Ứng dụng công nghệ giọng nói trí tuệ nhân tạo vào ngôn ngữ tự nhiên tiếng Việt và cho kết quả giọng nói tự nhiên như con người, có cảm xúc chính là giải pháp mà Vbee.ai mang đến cho người dùng Việt. Không chỉ là một sản phẩm công nghệ, ứng dụng chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên Vbee (Vbee Text To Speech) còn là giải pháp vô cùng nhân văn khi giúp cộng đồng người khuyết tật tiếp cận được thông tin như người bình thường.

Dự án hỗ trợ cộng đồng Vbee Text To Speech

Dự án phát triển công nghệ giọng nói bắt đầu được nghiên cứu từ năm 2009 và hoàn thành vào tháng 1/2018. “Hỗ trợ người khiếm thị có thể tiếp cận thông tin tốt hơn” là mục tiêu đầu tiên mà những nhà sáng lập Vbee mong muốn khi bắt tay vào nghiên cứu giải pháp chuyển văn bản tiếng Việt thành giọng nói.

Được nghiên cứu khoảng vài chục năm trước, đặc biệt phát triển mạnh trong 10-15 năm gần đây, công nghệ giọng nói đã phát triển gần như hoàn thiện ở nước ngoài, đặc biệt tại các nước sử dụng tiếng Anh. Khi ứng dụng vào cuộc sống, công nghệ này mang lại lợi ích lớn cho cộng đồng người khuyết tật, như người khiếm thị, những người mất khả năng đọc, mất khả năng nói hoặc diễn đạt.

Sử dụng công nghệ giọng nói Vbee AIVoice TTS cho phép cộng đồng xây dựng nội dung số bằng tiếng nói một cách tự động, nhanh và tiết kiệm. Bởi thế, khi nhắc giải pháp Vbee TTS, không ít người nghĩ: “À biết rồi, đây là giải pháp nhân văn, giúp cộng đồng người khuyết tật tiếp cận được với thông tin như người bình thường”.

Công nghệ giọng nói hỗ trợ thông tin cho người khiếm thị 1

Công nghệ giọng nói Vbee được nghiên cứu kỹ lưỡng

Trong giai đoạn đầu, công nghệ giọng nói Text to Speech bắt nguồn từ một bộ máy cồng kềnh phức tạp, mô phỏng quá trình tạo ra tiếng nói giống cơ chế phát âm của của con người. Tuy nhiên, do độ phức tạp, chi phí cao mà chất lượng không tốt, nên nó chỉ “nằm” trong phòng nghiên cứu với mục đích thử nghiệm và chưa có tính ứng dụng trong đời sống.

Chị Nguyễn Thị Thu Trang – CTO Vbee chia sẻ: “Vbee là công nghệ đầu tiên phát triển ở Việt Nam dành cho ngôn ngữ tiếng Việt. Bởi đặc thù ngôn ngữ của chúng ta nhiều thanh, vần điệu, vùng miền… phức tạp nên khó áp dụng hơn rất nhiều và đây thực sự là bước ngoặt trong dịch vụ công nghệ áp dụng giọng nói nhân tạo cho thị trường Việt Nam”.

Mong muốn có một giọng nói nhân tạo có cảm xúc và đồng điệu như giọng nói của con người Việt là điểm khác biệt mà đội ngũ Vbee để tâm. Ví dụ, về giọng đọc, nhóm mất khá nhiều thời gian để tạo ra giọng có ngữ điệu thu hút và gần gũi nhất với người dùng, khác với ngôn ngữ máy đọc thông thường là đều đều, không tự nhiên mà Google hay Microsoft đang hỗ trợ cho tiếng Việt.

Công nghệ giọng nói hỗ trợ thông tin cho người khiếm thị 2

Khởi nghiệp với sản phẩm công nghệ giọng nói nhân tạo

Sau thời gian cung cấp sản phẩm với khách hàng phục vụ chủ yếu là người khiếm thị để tiếp cận thông tin một cách dễ dàng hơn, những người sáng lập của Vbee nhanh chóng nhận thấy nhu cầu sử dụng công nghệ giọng nói nhân tạo ngày một lớn ở nhiều lĩnh vực trên thị trường. “Khi triển khai các ứng dụng, chúng tôi phát hiện rằng, công nghệ này còn có thể ứng dụng rộng rãi hơn, ở nhiều lĩnh vực trong tương lai” – chị Thu Trang chia sẻ.

Gặp hai người cùng chí hướng, cô giáo trẻ quyết định thành lập Công ty Cổ phần Dịch vụ và Giải pháp công nghệ Vbee – với nền tảng công nghệ cốt lõi là Text to Speech.

Vbee đã được đóng gói và cung cấp trong các dịch vụ hoàn chỉnh cho thị trường Việt Nam. Được biết đến là công ty nghiên cứu, phát triển các giải pháp, dịch vụ số hóa dữ liệu và nền tảng công nghệ giọng nói trí tuệ nhân tạo, tập trung chính vào công nghệ TTS và hội thoại thông minh. Các ứng dụng Vbee đang phát triển và triển khai bao gồm tổng đài tự động, báo nói, sách nói, thuyết minh phim tự động…

Công nghệ giọng nói hỗ trợ thông tin cho người khiếm thị 3

Khó khăn khi bắt đầu phát triển một sản phẩm mới

Ngay từ khi bắt đầu, dự án nghiên cứu chỉ được thực hiện với mong muốn là có thể tạo ra các ứng dụng giúp đỡ cho người khuyết tật. Vì vậy, khi bắt đầu thương mại hoá, giống như nhiều công ty khởi nghiệp khác, Vbee cũng gặp rất nhiều rào cản như vốn, thủ tục hành chính hay nhân sự…

Tuy nhiên, khi quyết định khởi nghiệp, Vbee đã lường trước được điều đó và sẵn sàng đối mặt với khó khăn. Sau hơn 1 năm hoạt động chính thức, Vbee đã dần đi vào ổn định. Khó khăn lớn nhất mà Vbee gặp phải, có thể nói là xu hướng công nghệ. Việc “chạy” kịp với các công nghệ giọng nói nhân tạo trên thế giới đòi hỏi nguồn lực rất lớn, cả về nhân sự và nguồn vốn.

Bên cạnh đó, do Vbee là startup sử dụng công nghệ lõi, nên đòi hỏi thời gian thị trường hấp thụ lâu hơn so với những sản phẩm mang tính chất thương mại. Các thành viên trong công ty buộc phải tận dụng thế mạnh của nhau, giảm bớt nguồn chi phí để tập trung giải các bài toán trước mắt.

Công nghệ giọng nói hỗ trợ thông tin cho người khiếm thị 4

Công nghệ giọng nói Vbee đã đạt được thành tựu gì?

Tính đến thời điểm hiện tại, Vbee đã trở thành đối tác cung cấp các giải pháp giọng nói nhân tạo cho nhiều doanh nghiệp lớn trong nhiều lĩnh vực: Thương mại điện tử (Shopee, Sendo,..), Tài chính (FE Credit, VietCredit,…), Ngân hàng (Sacombank, TP Bank,…)

Vbee hiện đang là công ty cung cấp giải pháp trợ lý ảo lớn nhất và đầu tiên tại Việt Nam với hơn 500.000 người sử dụng, hơn 300 doanh nghiệp SMEs và doanh nghiệp lớn, cũng như hơn 200 triệu cuộc gọi tư vấn bằng tổng đài viên ảo. Và hơn 60 tỷ ký tự đã được chuyển đổi từ văn bản thành giọng nói.

Công nghệ giọng nói của Vbee mang lại những giá trị to lớn cho xã hội – Một cách tiếp cận thông tin hoàn toàn khác, hoàn toàn miễn phí để hỗ trợ người khuyết tật. Đặc biệt là những người khiếm thị và những người mất khả năng nói. Với công nghệ giọng nói Vbee Text To Speech, người khiếm thị có thể tiếp cận thông tin, sử dụng máy tính để khai thác kiến thức vô tận trên Internet và đời sống.

Công nghệ giọng nói hỗ trợ thông tin cho người khiếm thị 5

Định hướng phát triển trong tương lai

Là một trong những đề tài trên giấy hiếm hoi có thể thương mại hoá thành công trên thị trường, Vbee mong muốn trở thành nguồn cảm hứng cho các nhà khoa học, biến các đề tài, dự án thành những sản phẩm hoàn thiện, bước ra và đi vào ứng dụng thực tiễn.

Ngay từ khi mới ra mắt, công nghệ giọng nói tiếng Việt của Vbee đã lập tức gây được tiếng vang lớn dù rất nhiều công ty, tập đoàn lớn cũng tham gia vào lĩnh vực xử lý ngôn ngữ tương tự. Điển hình như trong nước có FPT, Viettel; còn nói tới những “gã khổng lồ” thì luôn có Google, Amazon luôn chực chờ để thâm nhập thị trường Việt. Thị trường công nghệ rất rộng, và mỗi cách đi sẽ cho kết quả khác nhau. Vbee sẽ phải nỗ lực không ngừng để có thể cạnh tranh với nhiều đối thủ lớn.

Bằng cách dựa trên nền tảng công nghệ lõi, Vbee sẽ “đóng gói” được những dịch vụ phù hợp với thị trường ngách. Trong tương lai, Vbee sẽ tiếp tục nghiên cứu, xây dựng giải pháp đồng bộ về công nghệ giọng nói tiếng Việt có tâm hồn, có cảm xúc. Với gần 15 năm nghiên cứu, có thể nói, Vbee đã đi lên từ ngôn ngữ chứ không phải áp dụng IT để giải quyết vấn đề về ngôn ngữ.

Đánh giá bài viết
Theo dõi
Thông báo của
guest

0 Góp ý
Phản hồi nội tuyến
Xem tất cả bình luận
0
Rất thích suy nghĩ của bạn, hãy bình luận.x
MỤC LỤC