Có một vấn đề

Bạn có mơ ước được sống trong một thành phố, nơi mà bạn có thể vô tư đi dạo không phải sợ hãi điều gì trong công viên vào ban đêm không? Bạn có muốn thôi không phải lo lắng khi con của bạn đi từ trường về nhà không?

Phải thừa nhận rằng, có lẽ từ lâu bạn đã mơ ước được đưa đứa cháu của mình đi xem đá bóng nhưng rồi mọi thứ không như mong đợi khi những người hâm mộ đánh nhau, ẩu đả và ảnh hưởng đến xung quanh. Làm thế nào để bảo vệ con cháu của bạn khỏi tình cảnh này?

Thế còn rác rưởi trên đường phố thì sao? Bạn thực sự chán ngán cảnh bẩn thỉu như vậy? Người nào đó đã xả rác! Bạn không muốn có người phá hoại những cây xanh mới trồng trong sân hay nghe tiếng văng tục, chửi bậy ở lối đi chung…

Trên thực tế, nhiều người muốn như vậy. Sẽ không quá lời khi nói rằng hầu hết mọi người đều mơ ước một “cuộc sống sạch”. Ai cũng muốn sống trong một thành phố trong lành, yên tĩnh, không có những kẻ bợm rượu bắt nạt mọi người xung quanh trước cửa, những đống rác to đùng bên đường, hay cả đèn đường bị vỡ hỏng.

Tất nhiên, chính quyền có thể cử những nhân viên mặc đồng phục đi tuần tra trên đường phố: sẽ cần rất nhiều nam nhân viên, mà điều này thì không phải thành phố nào cũng có khả năng làm được. Chúng ta có thể nhớ lại thời kỳ Liên Xô với những con người nhiệt huyết, xung phong tình nguyện, nhưng bây giờ bạn có thể lôi kéo được những ai như thế, liệu có đủ số lượng cần thiết không? Cũng có thể treo một vài chiếc camera giả ở những nơi sáng sủa (thậm chí cả ở cái đèn hỏng cũng là camera), nhưng xét cho cùng, một người, một cá nhân không giống như một chiếc xe — chúng ta không có biển số đăng ký. Tuy nhiên, vẫn có một phương án. Và phương án đó có ở thời đại ngày nay, nó gắn liền với các sản phẩm công nghệ cao. Lần này, công nghệ nhận dạng khuôn mặt và phân tích video sẽ được áp dụng để đảm bảo việc thực thi luật pháp và trật tự xã hội cũng như đảm bảo an ninh!

Chỉ cần đừng vội gạt bỏ nó vì nghĩ rằng đây là điều gì đó viễn tưởng, chỉ có thể được thực hiện sau 50 năm nữa và chỉ có ở các siêu đô thị lớn trên thế giới. Công nghệ này hoàn toàn thực tế đã có rồi, còn tương lai nhìn lại thì sao: xem kìa, nó đã bắt đầu rồi.

Có một giải pháp

Phòng thí nghiệm NtechLab của Nga gồm các chuyên gia giỏi nhất trong lĩnh vực máy học đã phát triển một trong những chương trình chính xác nhất và nhanh nhất để nhận dạng khuôn mặt trên video, được cung cấp cả dưới dạng SDK có thể được nhúng ở phía khách hàng và đám mây API xử lý các yêu cầu từ phía công ty-nhà phát triển…

Chúng tôi không nói nhầm lẫn — thuật toán thực sự là một trong những thứ chính xác nhất và nhanh nhất trên thế giới vào thời điểm hiện tại. Bằng chứng cho điều này là thử thách MegaFace-2015 do trường Đại học Washington tổ chức, trong đó thuật toán NtechLab cho kết quả tốt nhất, đánh bại hơn 90 đối thủ từ khắp nơi trên thế giới, bao gồm cả chương trình của nhóm Google.

Để hiểu thuật toán của tương lai hoạt động như thế nào và nó có liên quan như thế nào đến việc giải quyết vấn đề bảo mật, chúng ta cần nhìn lại quá khứ và chú ý vào gốc rễ của vấn đề - công nghệ, đó là phôi thai của thuật toán, cuối cùng hiểu nó đến từ đâu và nó là gì.

Mạng nơ-ron cho “những ấm trà”

Từ bài này bạn sẽ biết được: công nghệ nhận dạng khuôn mặt dựa trên hoạt động của mạng nơ-ron nhân tạo, được xây dựng trên nguyên tắc của mạng nơ-ron sinh học.

Nơ-ron (tế bào thần kinh) là một tế bào não nhỏ. Bản chất của nơ-ron là sự tích tụ và truyền thông tin theo một chuỗi tới các nơ-ron khác. Các tế bào thần kinh được kết nối với nhau bằng cách sử dụng sợi nhánh (dendrite, còn gọi là tua ngắn) và sợi trục (tua dài, axon) tạo thành cấu trúc giống quả cầu. Quả cầu mang thông tin này liên kết, đan xen với nhau tạo thành một mạng lưới nơ-ron. Thông tin được tích lũy và truyền đi bởi các tế bào thần kinh có thể rất khác nhau, mỗi khu vực của não chịu trách nhiệm cho một chức năng cụ thể của cơ thể, ví dụ, vận động hoặc thị giác. Trong trường hợp của thuật toán nhận dạng khuôn mặt video, chúng tôi quan tâm chức năng thứ hai.

Các nhà khoa học đã chuyển sang mô tả mạng lưới thần kinh sinh học vào cuối thế kỷ XIX. Nhưng chỉ hàng chục năm sau, họ bắt đầu nói về việc mô hình hóa một mạng nơ-ron nhân tạo. Tại sao các nhà khoa học cần điều này?

Đấy là cách con người được tạo ra — một cuộc sống có lẽ là chưa đủ với mỗi chúng ta, cần phải tạo ra một cái gì đó tương tự như vậy, cái gì đó hoàn thiện hơn, tốt hơn hiện tại. Giống như các nhà viết kịch và đạo diễn khoa học viễn tưởng đã nghĩ ra những “vật thể phi thường” mà hiện giờ chúng đã trở thành hiện thực, như y tá robot cảm xúc, máy bay không người lái, thực tế ảo…

Việc tạo ra trí tuệ nhân tạo, một sản phẩm làm việc không bao giờ biết mệt mỏi, không có sự nhầm lẫn, nói chung, đã phát triển từ nhu cầu tương tự để tạo ra một cuộc sống hoàn thiện hơn “cái gốc ban đầu”.

Một trong những tính năng chính của mạng nơ-ron nhân tạo là khả năng học hỏi của nó, hay còn được gọi là học sâu (deep learning). Đào tạo một mạng nơ-ron nhân tạo tương tự như đào tạo một mạng sinh học. Cả hai đều học hỏi từ những sai lầm. Bằng cách thử và sai, các quy tắc và mô hình nhất định được tích lũy vào trong hành vi của con người.

Trong bộ não nhân tạo, mọi thứ diễn ra gần giống như ở người — một chuyên gia xây dựng quy tắc, nó được kiểm tra, tương quan, thuật toán trở nên chính xác hơn, ít lỗi hơn và a-lê-hấp! — thuật toán được cấu hình để thực hiện một chức năng cụ thể.

Bạn còn nhớ chúng ta đã nói về các phân đoạn mạng chịu trách nhiệm cho các chức năng khác nhau? Điều tương tự cũng xảy ra với mạng nơ-ron nhân tạo. Sự khác biệt duy nhất là mạng lưới thần kinh chịu trách nhiệm cho một chức năng nào đó (ví dụ, khả năng nhìn thấy một đối tượng và so sánh nó với một đối tượng khác) không nằm trong não, mà được lập trình trong khuôn khổ của một nhiệm vụ cụ thể, trong trường hợp của chúng ta, đó là nhiệm vụ so sánh các hình ảnh khuôn mặt. Đối với một nhiệm vụ khác, chẳng hạn như nhận dạng ngôn ngữ, một thuật toán mới sẽ được mô hình hóa.

Bạn sẽ hỏi — Vậy nó liên quan gì tới sự an toàn đường phố, sạch sẽ ở lối đi hay xử lý tình huống tại các sân bóng đá? Chúng ta đã đi xa khỏi chủ đề cần nêu ư? Hoàn toàn không!

Thực tế là thuật toán do nhóm NtechLab tạo ra được điều chỉnh (đào tạo) để nhận dạng khuôn mặt chính xác đến mức bất kỳ camera an ninh nào, luồng video được xử lý bằng công nghệ nhận dạng khuôn mặt từ NtechLab, ngay lập tức biến thành vũ khí mạnh mẽ để theo dõi và bắt một tên tội phạm, một kẻ bắt nạt và những kẻ gây rối hay có những hành vi thô lỗ.

Vậy chính xác thì NtechLab cung cấp những gì và nó hoạt động như thế nào trong lĩnh vực bảo mật?

Hiện nay nhóm NtechLab giới thiệu hai sản phẩm dựa trên sự phát triển của chúng. Đầu tiên, đó là FindFace Enterprise SDK, được tích hợp vào các giải pháp ứng dụng khách có sẵn trực tiếp vào “đám mây” của khách hàng. Thứ hai, FindFace Cloud API, hoạt động bên phía công ty nhà phát triển.

Công nghệ nhận dạng khuôn mặt dựa trên đám mây của NtechLab cho phép:

  • Nhận diện khuôn mặt trong ảnh
  • Kiểm tra ảnh chụp nhanh được phát hiện dựa trên cơ sở dữ liệu trị giá hàng triệu đô la
  • Xác định danh tính của người được chụp ảnh

Thuật toán NtechLab là một trong những thuật toán tốt nhất của loại hình này xét về các chỉ số như:

Độ chính xác nhận dạng

  • 95% xác suất lọt vào top 10 khi tìm kiếm trong 10 nghìn bức ảnh
  • 88% cơ hội lọt vào top 10 khi tìm kiếm trong 1 triệu ảnh
  • Độ xác minh chính xác 99%

Tốc độ nhận dạng

  • 0,5 giây để xử lý 1 tỷ ảnh

Thành phố có thể trở nên an toàn hơn bằng cách tự động xác định những kẻ tình nghi và những người có biểu hiện hay tiềm ẩn nguy hiểm bằng cách sử dụng một thuật toán mạnh mẽ xử lý video từ camera an ninh!

Không quan trọng các camera được lắp ở vị trí nào: chúng có thể được tích hợp vào cảnh quan đô thị, hệ thống giao thông và cơ sở hạ tầng.
Phần mềm nhận dạng khuôn mặt sử dụng video giám sát tự động xác định đối tượng bị truy nã và gửi thông báo đến các cơ quan pháp luật. Kẻ vi phạm sẽ bất ngờ khi được cảnh sát hỏi thăm hoặc được “đón” bằng xe chuyên dụng, hoặc sẽ nhận được thư báo về hành vi vi phạm.

Tuy nhiên, vấn đề an toàn không chỉ giới hạn trong việc phạm tội.

Hạn chế tiếp cận các đối tượng theo danh sách “đen”, an ninh tại các điểm thi hành luật lưu động, xác định người tiềm ẩn hay biểu hiện nguy hiểm, làm việc với các kiểu hành vi và tìm kiếm cơ sở dữ liệu của các cơ quan thực thi pháp luật… Rất nhiều những kịch bản tuyệt vời sắp ra mắt trên các con phố nơi bạn sinh sống!

Một bức ảnh hoặc video thường là bằng chứng duy nhất để phát giác hành vi phạm tôi. Việc tìm kiếm cơ sở dữ liệu thông thường đòi hỏi nhiều thời gian, sự chú ý và khả năng sai sót cao.

Thuật toán từ nhóm NtechLab có thể tìm kiếm hàng triệu bức ảnh trong vòng chưa đầy một giây; bạn có thể xác định từng người trong một bức ảnh hoặc video, ngay cả khi những bức ảnh cuối cùng có trong cơ sở dữ liệu họ để ria mép, để râu và đeo kính, hay trong điều kiện thiếu ánh sáng và có một khoảng thời gian đáng kể từ ngày chụp với thời điểm diễn ra sự kiện thực tế.

Đọc thêm về các kịch bản kinh doanh và một số ứng dụng đáng kinh ngạc nhất phục vụ nhận dạng khuôn mặt từ máy ảnh ở một trong những bài tiếp theo của chúng tôi! Hãy ở lại với chúng tôi.