• English

Talk To Me – Đánh Giá Sách

Steve Jobs có vẻ là một người khá cứng đầu một khi ông muốn điều gì đó. Ngược dòng thời gian, trở về những năm 2010, ông muốn mua lại một công ty startup nhỏ ở San Jose, California. Giám đốc điều hành lúc bấy giờ là Dag Kittlaus và các cộng sự của mình vừa gọi vốn vòng 2 thành công và họ không muốn bán nó đi khi thấy được tiềm năng của đứa con này. Jobs liên hệ với Kittlaus 37 ngày liên tục cho đến khi anh xiêu lòng và chấp nhận bán lại doanh nghiệp 2 năm tuổi này cho Apple với giá trị trong khoảng 150 triệu USD đến 200 triệu USD. Công ty này tên là Siri.

Trợ lý ảo Siri – kẻ tiên phong trong việc sử dụng giọng nói để thực hiện tác vụ cá nhân

James Vhalos mở đầu quyển sách của mình bằng cách kể câu chuyện làm cách nào mà trợ lý Siri chiếm một vị trí không thể thay thế đối với iPhone trong cuốn sách mới đây nhất của anh, Talk to Me. Đây sẽ là cuốn sách phải đọc cho những ai  quan tâm đến lĩnh vực điều khiển bằng giọng nói (voice computing) mà e ngại không có nhiều kiến thức công nghệ liên quan đến lĩnh vực này.  Tiếp theo, tác giả liên tục những câu hỏi xung quanh trí tuệ nhân tạo (AI) và ý nghĩa của nó rải rác trong suốt quyển sách. Vhalos còn đặt những câu hỏi như :”Liệu một bot biết nói như Alexa có thể giúp ích gì cho những người già neo đơn hoặc trẻ nhỏ hay không?” và “Liệu máy tính có suy nghĩ không?” “Suy nghĩ thực sự là gì? Những câu hỏi này sẽ được tác giả chia sẻ bằng góc nhìn của ông ở những phần sau của chương sách dù có phần hơi rời rạc và chồng lấp với nhau.

Alexa Echo – một trong những loa nhận diện giọng nói được hỗ trợ bởi AI phổ biến nhất

Vhalos dành phần đầu còn lại của nội dung sách để miêu tả cuộc chiến nền tảng tác động như thế nào đến với điều khiển giọng nói. Ông đưa ra những ví dụ của những công ty lớn tham gia vào cuộc đua này, như Amazon, Google, Apple. Những ông lớn này có điểm chung là muốn gắn kết trợ lý ảo – hay những phần mềm điều khiển bằng giọng nói hỗ trợ bởi AI – vào càng nhiều thiết bị càng tốt, nhằm tạo nên một hệ sinh thái mới nổi và toàn vẹn. Amazon đến nay đã có hơn 10.000 nhân viên làm việc trong dự án Alexa để cung cấp một trải nghiệm đa sắc màu hơn trong cuộc đua này. Nhưng điều khiển giọng nói không chỉ là cuộc chơi của nền tảng. Nó còn có thể được ứng dụng bởi mọi công ty khác nhau, đặc biệt nếu như dự đoán của Vhalos rằng “Sự tiến bộ của điều khiển giọng nói là một bước ngoặt trong lịch sử loài người” là đúng.

“Với giọng nói, máy tính có thể tự làm mọi thứ theo cách của chúng. Chúng sẽ học cách chúng ta giao tiếp với nhau: Qua ngôn ngữ. Giọng nói chính vì vậy vô cùng tiềm năng cho máy tính học được mà không có trở ngại gì cả. Trong khi đó, chúng ta chỉ học được giọng nói vì chúng ta phải làm vậy cả đời để giao tiếp với nhau.” – Vhalos giải thích.

Công nghệ giọng nói đến nay đã phát triển vượt ra khỏi những gì con người kỳ vọng. Tại một số quốc gia, việc sử dụng giọng nói để điều khiển trợ lý ảo là một điều bình thường trong cuộc sống. Vì thế Vhalos dành những phần còn lại của Talk to Me để giải thích công nghệ hoạt động của quyển sách, đồng thời tìm ra những thách mới tiếp theo và các quyết định của doanh nghiệp trong tương lai.

Công nghệ điều khiển giọng nói là thành tựu tập hợp nhiều loại công nghệ khác nhau. “Sóng âm phát ra từ miệng chúng ta qua màn lọc sẽ được chuyển thành các từ, quy trình này trong máy tính được gọi là tự động nhận diện giọng nói. Sau đó bằng cách xác định điều bạn muốn thể hiện thông qua các từ này với nhau, máy tính sẽ dần học được cách hiểu ngôn ngữ tự nhiên của loại người (hay còn gọi là quy trình natural-language understanding). Khi hiểu được chúng, máy tính sẽ phản ứng lại bằng cách lệnh được tạo ra theo ngôn ngữ tự nhiên (hay natural-language generation). Và cuối cùng, máy tính sẽ phát ra câu phản hồi dựa vào việc đồng bộ với bộ giọng nói sẵn có của chúng.” – Vhalos giải thích quy trình này.

Lý do chúng ta nhận thấy sự bùng nổ của điều khiển giọng nói là vì deep learning trở nên phổ biến và cho phép các nhà nghiên cứu vượt qua các rào cản công nghệ. Ví dụ, thay vì phải có một người thật nói từng dòng mà máy tính gõ ra, những phương pháp được phát triển mới đây có thể huấn luyện mạng nơ-ron nhân tạo (neural network) tự phát ra những âm theo ý thích của chúng.

Nhìn chung, Talk to Me thành công trong việc giải thích vì sao công nghệ điều khiển giọng nói là một công nghệ thú vị và đầy hứa hẹn. Quyển sách cũng giải thích được vì sao “Tất cả công ty, từ tập đoàn lớn Facebook đến dịch vụ bán hoa 1-800-Flowers cũng say mê và tự hỏi: Liệu cuộc cách mạng về giọng nói có ảnh hưởng đến công ty chúng ta không? Đây sẽ là cơ hội hay thách thức để cung cấp trải nghiệm cho khách hàng và đem lại doanh thu cho doanh nghiệp?”. Và chúng đều được giải đáp một cách hạn chế những thuật ngữ quá đổi công nghệ để người đọc dễ tiếp thu và cảm thấy hào hứng trong suốt 10 chương của quyển sách.

——————–

Bạn nghĩ như thế nào về bài viết này? Hãy comment cho chúng tôi biết ý kiến của bạn nhé!

PRIMUS – TOP MANAGEMENT JOBS

Bình Luận