Tổng quan
G
Total Visits
0
All time
Unique Visitors
0
Unique IPs
Online Users
0
Real-time
Queue
505,094
Pending
Master Data
16,427
P+D+W
OSM Entities
615,547
OSM
Training Data
25,130
Labeled
PhoBERT NER
Token classification · 10 entities
Training
PhoBERT Siamese
Bi-Encoder address matching
Ready
mGTE Siamese
Multilingual baseline
Ready
LLM Qwen3-4B
Final normalization
Standby
Input
NER Output
Kết quả sẽ hiển thị ở đây...
Extracted Entities
LabelValueConfidence
Total Queue
505,094
Processed
0
Pending
505,094
Throughput
-- qps
Batch Control
Waiting for batch start...
Export for Annotation

Sử dụng Hybrid PreLabeler để tạo gợi nhãn tự động trước khi gửi cho team gán nhãn trên Label Studio.

Training Status
Labeled Data200 / 1,000
Model F1-ScorePending training
NER Labels10 entities
NER Label Registry
CodeNameColorHotkeyExample
Run Experiment

Chạy experiment_runner.py để so sánh 3 mô hình trên tập dữ liệu thực. Kết quả bao gồm Exact Match, Fuzzy Match, Component Accuracy và Latency.

MetricPhoBERTmGTELLMTarget
Exact Match------≥ 30%
Fuzzy Match------≥ 60%
Phường Acc------≥ 80%
Quận Acc------≥ 85%
Tỉnh Acc------≥ 90%
Throughput------≥ 20 qps
Tra cứu
Kết quả ánh xạ
Nhập tên phường/xã cũ để tra cứu quy tắc sáp nhập...

Tổng: 10,635 quy tắc ánh xạ từ mat.ward_mapping

prq.address_cleansing_queue
IDRaw AddressWardDistrictProvinceStatus
Click Refresh to load data...
Database Connection

Credentials loaded from .env file

System Info
Python3.11
PhoBERTvinai/phobert-base
mGTEgte-multilingual-base
LLMQwen/Qwen3-4B
Deadline25/05/2026