Tóm tắt văn bản tiếng Việt sử dụng cấu trúc diễn ngôn
Tóm tắt văn bản là một trong những bài toán điển hình của lĩnh vực Khai phá văn bản. Để giải quyết bài toán này, phần lớn các hướng tiếp cận trước đây đều dựa trên kết quả thống kê như TFxIPF, Title, Position,... Các phương pháp này thường đưa ra các kết quả tóm tắt có độ chính xác thấp. Trong bá...
Được lưu tại giá sách ảo:
Tác giả chính: | |
---|---|
Định dạng: | Bài báo |
Ngôn ngữ: | Vietnamese |
Xuất bản : |
2022
|
Truy cập trực tuyến: | https://dlic.huc.edu.vn/handle/HUC/1350 |
Từ khóa (tag): |
Thêm từ khóa
Không có thẻ nào, Hãy là người đầu tiên đánh dấu biểu ghi này!
|
Tóm tắt: | Tóm tắt văn bản là một trong những bài toán điển hình của lĩnh vực Khai phá văn bản. Để giải
quyết bài toán này, phần lớn các hướng tiếp cận trước đây đều dựa trên kết quả thống kê như
TFxIPF, Title, Position,... Các phương pháp này thường đưa ra các kết quả tóm tắt có độ chính xác
thấp. Trong báo cáo này, chúng tôi sẽ trình bày phương pháp tóm tắt văn bản tiếng Việt dựa trên
cấu trúc diễn ngôn (CTDN). CTDN là một phương tiện cho phép biểu diễn mối quan hệ diễn ngôn
giữa các đoạn văn bản (như quan hệ nhân-quả). Từ cây CTDN, ta có thể đánh giá được tầm quan
trọng của các đoạn văn bản và tiến hành trích rút hay tóm tắt nội dung văn bản. |
---|