Tổng quan
G
Total Visits
0
All time
Unique Visitors
0
Unique IPs
Online Users
0
Real-time
Queue
505,094
Pending
Master Data
16,427
P+D+W
OSM Entities
615,547
OSM
Training Data
25,130
Labeled
AI Intelligence Lifecycle

1. Thu thập

2. Xử lý NER

3. Gán nhãn

4. Retrain

5. Tăng trưởng

PhoBERT NER
Token classification · 10 entities
Training
PhoBERT Siamese
Bi-Encoder address matching
Ready
mGTE Siamese
Multilingual baseline
Ready
LLM Qwen3-4B
Final normalization
Standby
Input
NER Output
Kết quả sẽ hiển thị ở đây...
Extracted Entities
LabelValueConfidence
Total Queue
505,094
Processed
0
Pending
505,094
Throughput
-- qps
Batch Control
Waiting for batch start...
Export for Annotation

Sử dụng Hybrid PreLabeler để tạo gợi nhãn tự động trước khi gửi cho team gán nhãn trên Label Studio.

Training Status
Labeled Data200 / 1,000
Model F1-ScorePending training
NER Labels10 entities
NER Label Registry
CodeNameColorHotkeyExample
Run Experiment

Chạy experiment_runner.py để so sánh 3 mô hình trên tập dữ liệu thực. Kết quả bao gồm Exact Match, Fuzzy Match, Component Accuracy và Latency.

MetricPhoBERTmGTELLMTarget
Exact Match------≥ 30%
Fuzzy Match------≥ 60%
Phường Acc------≥ 80%
Quận Acc------≥ 85%
Tỉnh Acc------≥ 90%
Throughput------≥ 20 qps
Tra cứu
Kết quả ánh xạ
Nhập tên phường/xã cũ để tra cứu quy tắc sáp nhập...

Tổng: 10,635 quy tắc ánh xạ từ mat.ward_mapping

prq.address_cleansing_queue
IDRaw AddressWardDistrictProvinceStatus
Click Refresh to load data...
Database Connection

Credentials loaded from .env file

System Info
Python3.11
PhoBERTvinai/phobert-base
mGTEgte-multilingual-base
LLMQwen/Qwen3-4B
Deadline25/05/2026

1. Thu thập dữ liệu

Địa chỉ thô được thu thập từ các hệ thống hoặc upload hàng loạt.

2. Xử lý NER

AI bóc tách các thực thể (Tỉnh, Quận, Đường...) với độ tin cậy cụ thể.

3. Kiểm soát (Human-in-the-loop)

Các địa chỉ có độ tin cậy thấp được gán nhãn lại qua Label Studio.

4. Tái huấn luyện (Retrain)

Dữ liệu gán nhãn được đẩy ngược lại để huấn luyện mô hình (Fine-tuning).

5. Tăng trưởng thông minh

AI học mẫu mới, tự động giảm tỷ lệ lỗi trong tương lai.