An ninh mạng

Phát hiện lừa đảo thông qua giọng nói

Con người khó mà phân biệt được nhiều giọng nói nhưng công nghệ thì có thể. — Nguồn ảnh PR

Công ty bảo mật Hoa Kỳ Pindrop Security đã giới thiệu một công nghệ phân tích âm thanh giúp người dùng nhận diện cuộc gọi từ những kẻ lừa đảo cách đây 4 năm, và giờ đây công nghệ của họ sẽ được áp dụng để nhận diện ngữ âm, xác định tính vùng miền của giọng nói, nhận diện tiếng động môi trường, đặc điểm tần số âm thanh đường dây điện thoại của mỗi quốc gia.

Pindrop đang lên kế hoạch đưa ra dịch vụ đặc biệt vào cuối năm nay. Dịch vụ này sẽ cho phép các thiết bị được kết nối có thể xác thực qua giọng nói, biến giọng nói con người trở thành một sự kết hợp giữa tên người dùng và mật khẩu. Trong tương lai không xa, nó sẽ hứa hẹn cho phép chúng ta mở khóa xe hoặc mở khóa điện thoại bằng giọng nói.

Theo ông Vijay A. Balasubramaniyan, đồng sáng lập và là CEO của Pindrop thì giọng nói của mỗi người là độc nhất vô nhị, và mỗi con người đều có những thói quen nói chuyện của riêng họ.

Balasubramaniyan cho biết thêm, bảo mật đăng nhập bằng giọng nói sẽ giúp cho việc thực hiện các giao dịch phức tạp qua mạng hoặc qua các trợ lý ảo như Siri hay Alexa trở nên an toàn hơn. Nó cũng giúp ngăn chặn việc tiếng quảng cáo TV quá to hay tiếng trẻ em đùa nghịch làm vô tình đặt mua hàng hóa qua những ứng dụng này.

Quan trọng hơn, công nghệ này cũng có thể phát hiện ra nếu con người cố tình giả giọng, làm méo giọng của mình hay cố “đánh lừa” bằng cách phát bản ghi âm giọng nói của người khác. Balasubramaniyan cho biết hiện nay công nghệ chống lừa đảo thông qua phát hiện giọng nói đã được đưa vào sử dụng tại các tổng đài.

Theo báo cáo của Pindrop, công ty đã làm việc với 8/10 ngân hàng hàng đầu ở Mỹ và 2/5 công ty bảo hiểm hàng đầu trong việc phát hiện gian lận giọng nói qua điện thoại. Các tổng đài trả tiền dựa trên số lượng các cuộc gọi, và Pindrop cũng có thể đưa ra cấu trúc chi phí tương tự cho nhà sản xuất thiết bị IoT (Internet of Things).

Để phát hiện gian lận giọng nói qua điện thoại, hệ thống Pindrop không chỉ nghe giọng nói của người gọi khi họ đặt đơn hàng hay thanh toán/chuyển khoản, mà còn sử dụng các nguồn dữ liệu âm thanh khác để xác định người gọi đang gọi đến từ đâu, loại điện thoại và nhà mạng họ sử dụng là gì. Loại và đời của điện thoại cũng giúp đánh dấu các đặc điểm âm thanh riêng của họ trong cuộc trò chuyện.

Trên thực tế, mạng điện thoại ở nhiều nơi trên thế giới sẽ truyền các dải tần số âm thanh khác nhau dựa trên các yêu cầu khác nhau để cân bằng lượng tiêu thụ băng thông và chất lượng âm thanh. Ngay cả với công cụ gọi điện của Internet, ví dụ như Skype hay Google Voice, cuộc trò chuyện sẽ được chia nhỏ ra thành các “gói âm thanh” với các kích thước khác nhau để các thuật toán của Pindrop có thể phân biệt được.

Với công nghệ này, các công ty bảo mật như Pindrop sẽ cảnh báo khách hàng của mình khi họ có cuộc gọi lạ, ví dụ như một số điện thoại đăng ký ở Mỹ đang thực hiện cuộc gọi qua Skype hoặc qua nhà mạng nào đó ở Nigeria. Trong các trường hợp khác, công ty đã phát hiện ra các cuộc gọi có vẻ từ nhiều khách hàng và nhiều số khác nhau nhưng có cùng tín hiệu lừa đảo.

Công ty phân tích 147 đặc điểm khác nhau có thể giúp xác định sự độc đáo của một thiết bị và gắn nó với người gọi. “Mỗi thiết bị điện thoại phát ra một tín hiệu âm thanh rất đặc biệt khi cuộc gọi được thực hiện” - Balasubramaniyan cho biết. Ví dụ có một trăm cuộc gọi để tiếp cận cả trăm tài khoản khác nhau, nhưng chúng đều có 147 đặc điểm giống hệt nhau thì rõ ràng chúng được thực hiện ở cùng một thiết b.

Những kẻ lừa đảo ngày càng trở nên gian manh, quỷ quyệt hơn nên công ty đã tạo ra cơ sở dữ liệu lớn nhất thế giới về giọng nói của những kẻ lừa đảo nổi tiếng để ứng phó với chúng.

Công ty thậm chí còn mở riêng một tổng đài của riêng họ. Họ mua từ các hãng tàu sân bay số điện thoại của những khách hàng đã từng giao dịch (do có quá nhiều các cuộc gọi lừa đảo ở các hãng này). Hệ thống Pindrop đã nhận được khoảng 90.000 cuộc gọi lừa đảo mỗi ngày từ các số trên, thông thường chỉ bật một đoạn ghi âm của các đoạn nói ngắn như “Tôi có thể nghe giọng bạn rất rõ” – đủ dài để khiến người gọi phải giữ máy để nhận diện kết nối của họ.

Tất cả các dữ liệu về giọng nói của con người mà công ty đã lưu lại sẽ được sử dụng để tạo ra các sản phẩm IoT – những sản phẩm kết nối hoàn toàn qua internet – có khả năng phát hiện và chống gian lận một cách hiệu quả nhất.

“Chúng tôi biết có nhiều trường hợp con người tự làm méo giọng của mình. Nếu có thể biết được giọng nói sẽ biến đổi như thế nào từ một nguồn cơ sở dữ liệu đủ lớn, chúng ta sẽ có thể giải được vấn đề này tốt hơn”.

Nhấn vào đây để bình luận

Trả lời bình luận

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

ĐỌC NHIỀU

Lên trên
Chuyển đến thanh công cụ