Dashboard
Hệ thống Làm giàu và Chuẩn hóa Dữ liệu Địa chỉ Việt Nam
1. Thu thập
2. Xử lý NER
3. Gán nhãn
4. Retrain
5. Tăng trưởng
Model Status
Address Parser
Paste địa chỉ thô để NER bóc tách thành phần thực thể realtime
| Label | Value | Confidence |
|---|
Batch Processor
Xử lý hàng loạt từ hàng đợi prq.address_cleansing_queue
AI Training Hub
Quản lý dữ liệu huấn luyện và theo dõi fine-tuning PhoBERT NER
Sử dụng Hybrid PreLabeler để tạo gợi nhãn tự động trước khi gửi cho team gán nhãn trên Label Studio.
| Code | Name | Color | Hotkey | Example |
|---|
Model Comparison
So sánh 3 mô hình theo KPI thực chiến: F1, Throughput, Cost/1M và Google Match
Chạy experiment_runner.py để so sánh 3 mô hình trên tập dữ liệu
thực. Kết quả ưu tiên KPI MIS: F1, Throughput, Cost và Google Match.
| Model | F1-Score | Throughput | Cost / 1M | Google Match | Target | Status |
|---|---|---|---|---|---|---|
| PhoBERT | -- | -- | -- | -- | F1≥82% | TPS≥20 | Cost<$100 | Match≥75% | Pending |
| Siamese (mGTE) | -- | -- | -- | -- | F1≥82% | TPS≥20 | Cost<$100 | Match≥75% | Pending |
| LLM (Qwen3) | -- | -- | -- | -- | F1≥82% | TPS≥20 | Cost<$100 | Match≥75% | Pending |
Ward Mapper 2025
Tra cứu sáp nhập đơn vị hành chính theo Nghị quyết Chính phủ
Tổng: 10,635 quy tắc ánh
xạ từ mat.ward_mapping
Data Explorer
Duyệt và tìm kiếm dữ liệu trong hàng đợi xử lý
| ID | Raw Address | Ward | District | Province | Status |
|---|---|---|---|---|---|
| Click Refresh to load data... | |||||
OSM Enrichment Center
Làm giàu dữ liệu OpenStreetMap cho `raw_entities`, `streets`, `buildings` và `pois`
Settings
Cấu hình hệ thống và kết nối database
Credentials loaded from .env file
AI Training Hub
Trọng tâm: workflow trainning AI (Phase A-D), vận hành model, và so sánh hiệu quả thực chiến
Quy trình Hoạt động
Vòng lặp phản hồi giúp AI thông minh hơn mỗi ngày
1. Thu thập dữ liệu
Địa chỉ thô được thu thập từ các hệ thống hoặc upload hàng loạt.
2. Xử lý NER
AI bóc tách các thực thể (Tỉnh, Quận, Đường...) với độ tin cậy cụ thể.
3. Kiểm soát (Human-in-the-loop)
Các địa chỉ có độ tin cậy thấp được gán nhãn lại qua Label Studio.
4. Tái huấn luyện (Retrain)
Dữ liệu gán nhãn được đẩy ngược lại để huấn luyện mô hình (Fine-tuning).
5. Tăng trưởng thông minh
AI học mẫu mới, tự động giảm tỷ lệ lỗi trong tương lai.
Tra cứu Biến động ĐVHC
Theo dõi lịch sử sáp nhập, đổi tên xã phường qua các thời kỳ
NSO Sync Center (v2)
Đồng bộ dữ liệu hành chính trực tiếp từ Tổng cục Thống kê (NSO)