Cổng ty Cổ phần Công nghệ thông tin và Truyền thông Trường Giang

Tin công nghệ >>

Các ông lớn đang tranh đấu trên thị trường giọng nói trị giá 49 tỉ USD như thế nào (Phần 2)

Nối tiếp phần 1, phần 2 của bài viết sẽ đi vào tìm hiểu thị trường giọng nói đang có sự phát triển vượt bậc trong những năm gần đây như thế nào qua những động thái các ông lớn Facebook, Amazon, Microsoft, Google và Apple.

Apple

Vào năm 2011, khi Apple ra mắt lần đầu trợ lý ảo Siri, công ty đã tiến bước vào mảng mới là trợ lý ảo kích hoạt giọng nói. Việc thâm nhập muộn trong cuộc đua loa thông minh với HomePod đã khiến Apple vất vả cạnh tranh giành thị phần đã được củng cố của cả Google và Amazon.

Các nhà phân tích ngành chỉ ra một vài lỗi lớn của HomePod so với đối thủ, lớn nhất đó là nó không cơ động như Alexa hoặc “thông minh” như hệ thống AI của Google.

Apple HomePod không thông minh như các đối thủ (% truy vấn trong các lĩnh vực khác nhau trả lời đúng bởi các loa thông minh, đo trên các mảng như: để mua bán, định hướng, tra thông tin, ra lệnh). Nguồn: Statista.

Với những người dùng Apple, điều đó không thành vấn đề. Tuy nhiên, với những người không ở trong hệ sinh thái Apple tạo ra thì thật khó để tận dụng hết các sản phẩm của hãng.

Một lĩnh vực mà HomePod tỏ ra vượt trội đó là tính riêng tư và bảo mật với việc mua lại Silk Labs vào năm 2018 (công ty phát triển phần mềm hệ điều hành AI trên thiết bị giúp loại bỏ nhu cầu xử lý trên đám mây).

Làm cho giọng nói hoạt động ngay cả khi không có kết nối mạng

Bảo mật và quyền riêng tư đang trở thành thứ quan trọng nhất đối với người dùng sản phẩm có tích hợp giọng nói. Apple đã nộp hai bằng sáng chế gần đây, tập trung vào giọng nói và bảo mật.

Cái đầu tiên, trợ lý cá nhân offline giúp kích hoạt Siri thông qua giọng nói ngay cả khi không kết nối mạng. Với HomePod, các hội thoại giọng nói không được thu lại bởi phần lớn các hành động không được truyền lên môi trường điện toán đám mây mà thông qua thiết bị.

Tại đây, Apple đã áp dụng phương pháp khác so với đối thủ chính là Google, Amazon, vốn lưu trữ những trao đổi này trên máy chủ công ty sử dụng điện toán đám mây. Điều này tạo ra quan ngại về tính bảo mật, người dùng muốn biết dữ liệu nào được thu và lưu trữ lại.

Apple đang xây dựng phương pháp sử dụng kích hoạt giọng nói ngay trong thiết bị.

Bằng sáng chế này tạo ra một hệ thống Giọng nói tới Văn bản (Speech-to Text) hoạt động trên thiết bị người dùng mà không ở trên máy chủ của Apple. Thiết bị này có thể thực hiện yêu cầu dựa trên các tác vụ được xác định trước lưu trữ trong hệ điều hành. Người dùng có thể sử dụng Siri cả trực tuyến và ngoại tuyến.

Bằng sáng chế của Apple tạo ra một hệ thống giọng nói tới văn bản (Speech-to Text) hoạt động trên thiết bị người dùng mà không ở trên máy chủ của Apple. Nguồn: USPTO

Một bằng sáng chế liên quan cũng tập trung vào tính bảo mật và được cấp gần đây với tên gọi là “voice prints.”

Việc này sẽ giúp Siri xác định và phân biệt giữa nhiều người dùng khác nhau thông qua xác thực giọng nói.

Hợp tác với Salesforce

Căn nhà không phải là nơi duy nhất Apple muốn người dùng sử dụng giọng nói hoàn thành công việc. Gã khổng lồ công nghệ này đang hợp tác với Salesforce để đưa công nghệ giọng nói của Apple vào các ứng dụng. Người dùng sẽ dùng Siri cho các cập nhật và yêu cầu thay vì phải chuyển giữa các hệ thống với nhau để sử dụng.

Salesforce là một trong những công ty nổi tiếng nhất đưa ra công cụ bán hàng, tiếp thị cho khối doanh nghiệp. Công ty cũng có một đội ngũ các nhà phát triển phần mềm bên thứ ba có thể xử lý phần công nghệ back-end và tìm cách mới và tốt hơn tích hợp với iPhone và iPad của Apple.

Giám đốc điều hành Apple Tim Cook chia sẻ với Reuters về hợp tác này: ”Nếu bạn nhìn tổng thể vào doanh nghiệp, giọng nói vẫn được dùng nhiều như khối khách hàng đại chúng. Chúng tôi đang thay đổi cách con người làm việc và đây là trọng tâm Apple hướng tới — thay đổi để tốt hơn.”

Microsoft

Mặc dù Microsoft hiện diện tương đối sớm trong cuộc đua loa thông minh với Cortana nhưng phải chật vật cạnh tranh với Google và Amazon. Có vẻ rằng Microsoft đã chuyển hướng không cạnh tranh trực tiếp với Google và Amazon nữa, thay vào đó hướng tới hợp tác tích hợp với Amazon.

Hiện giờ, người dùng Windows 10 và Alexa đều có thể sử dụng tính năng giữa hai hệ thống. Người dùng Cortana có thể nói chuyện với Alexa thông qua Windows 10 và người dùng Alexa có thể truy cập Cortana để đọc email trên Outlook.

Đây là hợp tác chiến lược của hai gã khổng lồ công nghệ, mỗi hãng đều chiếm lĩnh lãnh địa mà không dễ cho các đối thủ mới gia nhập thị trường. Microsoft sẽ thu được một lượng khách hàng tiềm năng mới, những người cho rằng sự tích hợp của Cortana và Alexa là một lựa chọn giúp cải thiện năng suất xuất sắc, đặc biệt tại khối công sở mà các skill của Alexa được dùng cho các tác vụ đơn giản. Những người dùng khối doanh nghiệp đang kỳ vọng Cortana của Microsoft đóng vai trò mang giọng nói vào doanh nghiệp trong một vài năm tới.

Đầu tư vào trợ lý giọng nói doanh nghiệp trong vòng 2 năm tới (Cortana: 78%;Google Assistant- 78%; Echo-77%; Watson-69%; Siri-68%; Bixby-62%; Co-Pilot-54%) Nguồn: Voicebot.ai

Microsoft gần mua lại Semantic Machines, một công ty phát triển AI hội thoại, cho thấy việc hợp tác với Alexa là quan trọng như thế nào trong việc giới thiệu bộ sản phẩm nâng cao năng suất lao động có kích hoạt giọng nói.

Các sáng chế

Gần đây, Microsoft được cấp một bằng sáng chế được gọi là “đầu vào giọng nói yên lặng.” Nó cho phép người dùng kích hoạt các lệnh giọng nói khi thì thầm, giúp nhận ra giọng nơi công cộng.

Gần đây, hầu hết người dùng sử dụng giọng nói chủ yếu trong nhà hoặc xe ô tô và họ thường tránh ra lệnh bằng giọng nói nơi công cộng.

Công nghệ này sẽ có mặt trong một vài thiết bị, từ điện thoại thông minh cho tới đồng hồ thông minh và các thiết bị điều khiển từ xa. Thiết kế của bằng sáng chế này tạo cảm giác điệp vụ James Bond đang thì thầm vào trong đồng hồ thông minh.

Các cách tiếp cận mới đối với công nghệ giọng nói sinh trắc học là lĩnh vực Microsoft đặc biệt quan tâm. Công ty gần đây đã nhận ID R&D, một công ty sinh trắc học giọng nói vào chương trình IoT& AI Insider Labs.

Facebook

Mặc dù Facebook có tham vọng về mảng giọng nói nhưng công ty gia nhập thị trường rất muộn. Việc trì hoãn này đánh đổi trực tiếp vào thị phần của công ty.

Hầu hết những bước đi của Facebook trong mảng này là qua tin đồn công ty đang phát triển lập trình mảng giọng nói, giúp người dùng sử dụng nhận diện giọng nói trên Facebook và Facebook Messenger.

Một vài bước đi gần đây của công ty cho thấy công ty đang tập trung vào công nghệ chatbot. Facebok đã mua lại wit.ai, công cụ giúp bổ sung giao diện giọng nói vào ứng dụng và công bố tích hợp NLP vào ứng dụng messenger. Hai sự kiện này cho thấy Facebook trông đợi vào tiềm năng của hội thoại AI trong chatbot tương lai.

Portal

Vào cuối năm 2018, Facebook đã giới thiệu Portal, sản phẩm đánh dấu sự gia nhập của hãng vào thị trường loa thông minh. Facebook muốn tiến thêm một bước khỏi lĩnh vực giọng nói bằng cách giới thiệu thiết bị video dựa trên AI và một camera thông mình của thể giao tiếp được. Facebook cũng hợp tác với Amazon.

Portal tích hợp với Alexa thông qua giọng nói, cho người dùng tiếp cận các skill của Alexa. Điều này khá ngạc nhiên với nhiều người bởi nếu Facebook dựa trên Alexa mà không phải là hệ thống voice của riêng mình thì công ty sẽ không thể thu thập dữ liệu người dùng.

Đương nghiên, vấn đề chính Facebook cần khắc phục đó là nỗi lo về quyền riêng tư. Năm ngoái, công ty đã bị chỉ trích dữ dội về quyền riêng tư. Cho tới nay doanh số bán Portal vẫn rất thấp. Facebook gần đây nâng cấp hệ thống với một vài sửa đổi, đặc biệt xung quanh lúc camera được kích hoạt, dựa trên các đánh giá của người dùng.

Giọng nói tại thị trường Trung Quốc

Tăng trưởng loa thông minh và giọng nói không chỉ giới hạn ở các công ty công nghệ hàng đầu tại thị trường Hoa Kỳ. Tại khu vực Châu Á Thái Bình Dương, Trung Quốc, chúng ta đang chứng kiến sự gia tăng lớn doanh số loa thông minh và thiết bị nhà thông minh vẫn chưa có dấu hiệu dừng lại

Người dùng loa thông minh tại Trung Quốc, 2017-2020 (Triệu người, % thay đổi và % người dùng internet). Năm 2018 có 34.2 triệu người, năm 2020 có 111.7 triệu người. Nguồn- eMarketer.

Không chỉ các công ty Hoa Kỳ mà các công ty Trung Quốc như Alibaba, Xiao Mi đóng góp vào tăng trưởng chung tại Trung Quốc khi hai công ty này chiếm tới 94% doanh số bán loa thông minh tại Trung Quốc trong quý đầu năm 2018.

% bán ra (loa thông minh) của các hãng (Amazon, Google, Alibaba, Xiaomi, khác). Nguồn: CBInsights.

Trong những năm gần đây, cả Alibaba và Xiaomi đều giảm giá đáng kể để thu hút khách hàng đến với sản phẩm của họ và làm giảm tăng trưởng của Google và Amazon trên khu vực.

Một công ty khác là Baidu. Hiện tại, công ty là công cụ tìm kiếm lớn nhất ở Trung Quốc. Giống như Google, họ đang sử dụng phương pháp tiếp cận trợ lý tìm kiếm cho các hệ thống AI và giọng nói của mình so với các phương thức kiểu Amazon trong thương mại điện tử của Alibaba. Hệ thống DuerOS của nó được cài trong loa thông minh cũng như hơn 100 thiết bị thông minh được hỗ trợ bởi hơn 16.000 Nhà phát triển skill.

Có những tiến triển khác cần lưu ý và có khả năng thâm nhập thị trường loa thông minh ở Trung Quốc. Đầu tiên, Apple đã công bố HomePod tại Trung Quốc vào tháng 1 năm 2019. Khác với Google Assistant và Alexa, HomePod hỗ trợ cả tiếng phổ thông và tiếng Quảng Đông, hai ngôn ngữ phổ biến nhất ở Trung Quốc. Mặc dù điều đó mang lại cho Apple cơ hội thâm nhập thị trường, yếu tố cạnh tranh chính có thể sẽ dựa trên giá cả. HomePod tại Trung Quốc sẽ có giá cao hơn đáng kể so với các sản phẩm loa thông minh từ Alibaba và Baidu.

Huawei là một công ty Trung Quốc khác có công nghệ loa và giọng nói thông minh, và bây giờ công ty đang tìm cách mở rộng ra bên ngoài thị trường Trung Quốc. Trong khi hệ thống Xiaoyi của nó là đối tác hiện tại với cả Amazon và Google, Richard Yu, CEO khối khách hàng tiêu dùng Huawei, đã nói với CNBC về kế hoạch phát triển công nghệ AI của mình cho các thị trường khác.

“Ban đầu, chúng tôi chủ yếu sử dụng Google Assistant và Amazon Alexa. Chúng tôi cần thêm thời gian để xây dựng các dịch vụ AI của mình… Sau đó, chúng tôi sẽ mở rộng dịch vụ này ra bên ngoài Trung Quốc.”

Nếu việc mở rộng đó diễn ra, Huawei sẽ cạnh tranh trực tiếp với Google, Apple và Amazon. Và đó là điều mà các thương hiệu công nghệ lớn khác của Trung Quốc sẽ theo dõi sát sao khi giọng nói chiếm lĩnh khu vực này.

David Mercer, Phó Chủ tịch Strategy Analytics khẳng định thị trường loa thông minh sẽ tăng trưởng mạnh mẽ chứ không chỉ là một xu hướng nhất thời tại thời điểm này. Chỉ tính riêng thị trường Mỹ, theo dự báo mới nhất của eMarketer, số người sử dụng loa thông minh sẽ tăng với tốc độ tăng trưởng hàng năm (CAGR) 47,9% từ năm 2016 đến năm 2020, từ 16 triệu đến 76,5 triệu loa. Trong tương lai không xa, giọng nói trở thành một phương thức tương tác công nghệ tiêu chuẩn kết hợp với các phương thức tương tác hiện nay như bàn phím, chuột và màn hình cảm ứng. Theo đó, thị trường loa sẽ cạnh tranh khốc liệt hơn và trực tiếp giữa các công ty công nghệ theo từng ngôn ngữ khác nhau.

Ngoài ra, mua sắm thông qua giọng nói (Voice Commerce) có xu hướng sẽ phát triển trong tương lai. Theo Amazon, đến năm 2021, 50% những hoạt động tìm kiếm thông tin sẽ được thực hiện bằng giọng nói.

Việc phân bổ thời gian và nguồn lực đầu tư là bài toán cốt lõi mà các công ty cần nghiên cứu và giải quyết, ảnh hưởng trực tiếp đến vị thế trên thị trường của các công ty này. Xử lý ngôn ngữ tự nhiên, internet vạn vật, trí tuệ nhân tạo là những công nghệ mà các công ty cần tập trung nghiên cứu và phát triển để có thể đưa ra một sản phẩm tốt cho người dùng.

Là một thị trường mới và đầy tiềm năng, đối với thị trường loa thông minh và giọng nói tại Việt Nam, các công ty có khá nhiều lựa chọn về thị trường ngách tấn công, nhóm đối tượng khách hàng, tính năng ưu việt của sản phẩm. Nhìn chung, đối với riêng thị trường Việt, miếng bánh thị phần đang rộng mở cho các công ty công nghệ, startup tấn công và chiếm lĩnh.