Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  30,119,904
  • Công bố khoa học và công nghệ Việt Nam

50.41; 50.03

Người máy và điều khiển tự động

Đặng Ngọc Đức, Nguyễn Ngọc Tùng(1)

Gán nhãn âm vị trong quá trình xây dựng cơ sở dữ liệu tiếng Việt

TC Bưu chính viễn thông

2003

10

79-88

0866-7039

Qui trình xây dựng một cơ sở dữ liệu (CSD)L tiếng gồm có hai giai đoạn chính: thu thập dữ liệu, phiên âm chính tả và gán nhãn thời gian ở mức âm vị. Bài báo trình bày giai đoạn cuối cùng: gán nhãn thời gian ở mức âm vị cho các phát âm. Gán nhãn (Labeling) là công việc xác định ra các ranh giới các âm vị trong một từ. Các nhãn thời gian (Time-Align label) được tạo bằng hai cách: gán nhãn bằng tay do người gán nhãn thực hiện bằng tay dựa vào việc đọc các thông tin trên biểu đồ sóng và biểu đồ phổ hoặc gán nhãn tự động bằng phương thức gán nhãn cưỡng bức. Bài báo trình bày cả cấu trúc âm tiết tiếng Việt và bộ ký tự phiên âm tiếng Việt

TTTTKHCNQG, CVv 22