04:07, 31/07/2009

Hệ thống xử lý tiếng Việt tự động phân loại thông tin

Hệ thống xử lý tiếng Việt tự động EPI giúp các website có khả năng tự động phân loại bài báo vào một trong số hơn 40 chuyên mục nội dung có sẵn với độ chính xác hơn 90%.

Ảnh minh họa.

Nhóm kỹ sư thuộc Công ty EPI Technologies (Hà Nội) đã nghiên cứu thành công hệ thống xử lý tiếng Việt tự động phân loại thông tin theo cách của người đọc, đáp ứng nhu cầu tìm kiếm thông tin tiếng Việt mới nhất trên mạng theo từng chủ đề mà độc giả quan tâm.

 

Hệ thống xử lý tiếng Việt tự động EPI đã được ứng dụng trên website baomoi.vn, giúp website này có khả năng tự động phân loại bài báo vào một trong số hơn 40 chuyên mục nội dung có sẵn với độ chính xác hơn 90%.

 

Hệ thống cũng cho phép tự động tìm và phân nhóm các bài báo có nội dụng tương tự bài báo gốc với độ chính xác gần 100% và tự động tìm các bài báo liên quan với bài báo gốc về một chủ đề nào đó.

 

Nhờ có hệ thống EPI, người đọc có thể dễ dàng tìm kiếm các bài liên quan tới một từ khóa theo chuyên mục có nội dung riêng, cũng như tạo cho mình những chuyên mục theo yêu cầu riêng và chia sẻ với mọi người.

 

Hệ thống này vừa đoạt giải nhì cuộc thi Trí tuệ Việt Nam 2007. Hiện nhóm kỹ sư EPI  đang tiếp tục nghiên cứu mở rộng hệ thống xử lý ngôn ngữ tiếng Việt sang các lĩnh vực khác như hình ảnh, video, blog.

 

Theo TTXVN