Chào tất cả các bạn!

Chúng ta đã nói chi tiết về mạng nơ-ron, học máy, số liệu và phương pháp thử nghiệm thuật toán nhận dạng khuôn mặt nhiều lần.

Lần này chúng tôi quyết định sẽ nói về sản phẩm của mình dựa trên thuật toán nhận dạng khuôn mặt của riêng chúng tôi. Hơn nữa, phiên bản mới của sản phẩm hàng đầu FindFace SDK của chúng tôi vừa được phát hành cách đây không lâu. Nhưng trước tiên, hãy cùng nhắc lại một chút lịch sử: Chúng tôi nghiên cứu việc tạo ra một hệ thống nhận dạng khuôn mặt.

Hiệu quả cao từ công nghệ

Trong quá trình tạo ra hệ thống nhận dạng khuôn mặt, các tác giả phải đối mặt với nhiệm vụ tìm kiếm trên một lượng dữ liệu lớn. Khi tạo ra được thuật toán, cần phải kiểm tra nó với một lượng dữ liệu ảnh khổng lồ. Vào thời điểm đó, cơ sở dữ liệu MegaFace rất thích hợp để thử nghiệm thuật toán được viết cho vấn đề này và vào tháng 9 năm 2015, nhóm NtechLab đã gửi thuật toán của mình đến giải vô địch thế giới MegaFace Challenge.

Vào tháng 12 năm 2015, kết quả của cuộc thi đã công bố rằng thuật toán được thừa nhận là giải pháp tốt nhất. Vị trí số một trong một cuộc thi quan trọng như vậy đã nói lên chất lượng không thể phủ nhận của mã chương trình.

Vào thời điểm đó, công ty đã hiểu rõ rằng công nghệ này có thể và nên được «sản phẩm hóa», tức là cung cấp một sản phẩm dựa trên thuật toán nhận dạng khuôn mặt. Nhưng trước hết cần phải chỉ ra thuật toán hoạt động ra sao, chứng minh hoạt động của thuật toán trong một trường hợp thực tế, trong việc giải một bài toán cụ thể và có thể áp dụng vào cuộc sống. Việc tổ chức một cuộc trình diễn như vậy cho đông đảo khán giả có lẽ là cách đúng đắn nhất.

Do đó, nhóm đã đưa ra quyết định khởi chạy dịch vụ FindFace.RU cùng với các đối tác. Bất kỳ người dùng nào cũng có thể tải ảnh lên dịch vụ và tìm một người tương tự trên mạng xã hội VKontakte.

Hệ thống này đã hoạt động một cách tuyệt vời và chỉ trong vài ngày, nó đã trở nên cực kỳ phổ biến, còn các đề nghị hợp tác đã không cần phải chờ đợi lâu. Công ty đã nhận được các cuộc gọi từ các khách hàng và đối tác tiềm năng từ khắp nơi trên thế giới. Hơn nữa, chính những người gọi tới đã đề xuất các kịch bản áp dụng có thể xảy ra, đưa ra các giải pháp của riêng họ: từ mạng xã hội và dịch vụ hẹn hò đến hệ thống bán lẻ và bảo mật.

Các tính năng và lợi ích của giải pháp đám mây

Rõ ràng là mọi người cần một dịch vụ nhận dạng khuôn mặt để sử dụng giải quyết các vấn đề kinh doanh của mình. Dựa trên kết quả của tất cả các yêu cầu và đề xuất nhận được, chúng tôi đã phát hành sản phẩm đầu tiên của mình — dịch vụ đám mây, dịch vụ sẽ giúp khách hàng cũng như đối tác tiềm năng không chỉ kiểm tra thuật toán và các kịch bản mà chúng tôi đề xuất mà còn mang đến cho họ cơ hội để tự mình thử làm một điều gì đó dựa vào nó.

Nền tảng đám mây giúp tích hợp đầy đủ công nghệ của chúng tôi vào các giải pháp của bên thứ ba thông qua API REST. Sử dụng API, các yêu cầu được gửi đến đám mây sản phẩm phục vụ các nhiệm vụ chính: xác minh và tìm kiếm người trong cơ sở dữ liệu; sau đó ít lâu, nhận dạng tuổi tác, giới tính và cảm xúc được bổ sung thêm cho đối tượng được tìm kiếm đó.

Tất nhiên, tại thời điểm tạo ra giải pháp đám mây, chúng tôi hiểu rằng nó có những hạn chế riêng: khối lượng tài nguyên lớn khi làm việc với luồng video, nhu cầu lưu trữ dữ liệu của mình trên đám mây.

Ngoài ra, điều dễ nhận thấy là các vấn đề kinh doanh khác nhau sẽ đòi hỏi một cách tiếp cận khác nhau cho giải pháp của họ. Nếu khách hàng không quan tâm đến khả năng xử lý video, chỉ cần nhận dạng khuôn mặt trong ảnh, FindFace Cloud API là thứ bạn cần: nó cực kỳ dễ sử dụng, bạn không cần phải triển khai máy chủ để làm việc với nó, bạn cũng không cần cài đặt bất cứ thứ gì. Giải pháp đám mây thực sự hoàn hảo cho các dịch vụ web, cho nhà phát triển các ứng dụng di động khác nhau, v.v.

Tuy nhiên, nhu cầu thị trường không có nghĩa là chỉ giới hạn trong các nhiệm vụ như vậy. Nhiều công ty muốn áp dụng công nghệ nhận dạng khuôn mặt vào việc phát triển, có thể là một sản phẩm cần thiết, một sản phẩm có thể

a) hoạt động trực tiếp trên cơ sở hạ tầng của khách hàng

b) hoạt động với luồng video (các khả năng của đám mây, ngay cả khi tùy chọn như vậy xuất hiện trên đám mây, chúng vẫn bị hạn chế về mặt này).

Đặc điểm và lợi ích của giải pháp máy chủ

Do đó, sau FindFace Cloud API, công ty đã tung ra một sản phẩm mới — FindFace Enterprise Server SDK. Nó có thể được tích hợp vào cơ sở hạ tầng của bất kỳ công ty nào quan tâm đến việc phát triển kinh doanh của họ bằng công nghệ nhận dạng khuôn mặt.

Giải pháp máy chủ dành cho các hệ sinh thái khách hàng phức tạp hơn nhiều và trước hết nó phù hợp cho các công ty lớn, khách hàng của họ quan tâm đến vấn đề làm việc với các luồng video và đảm bảo quyền riêng tư cho: các ngân hàng, chuỗi bán lẻ, chuyên gia bảo mật.

Đồng thời, cần hiểu rằng việc tích hợp FindFace Enterprise Server SDK sẽ không đòi hỏi nhân viên kỹ thuật của một công ty cụ thể cần phải có những kiến ​​thức đặc biệt trong lĩnh vực mạng thần kinh và học máy.

Ngày nay FindFace SDK cung cấp một bộ dịch vụ độc đáo, bao gồm mô-đun nhận diện khuôn mặt riêng, công nghệ nhận dạng, xác định giới tính, tuổi tác và cảm xúc của một người. Việc tích hợp vào bất kỳ giải pháp nào diễn ra bằng cách sử dụng API. Sản phẩm máy chủ, cũng giống như sản phẩm đám mây, cho phép giải quyết các nhiệm vụ chính thuộc nhận dạng khuôn mặt như: xác minh, nhận dạng, nhận dạng giới tính, tuổi và nhận dạng cảm xúc, nhưng việc xử lý các yêu cầu diễn ra trên máy chủ khách hàng chứ không phải trên đám mây.

Phiên bản mới nhất của sản phẩm đã giới thiệu hỗ trợ video trong Giao diện người dùng (FindFace User Interface, FFUI):

Hình 1. Làm việc với video trong giao diện người dùng.

Tính năng kích hoạt bộ dò video cho vùng riêng biệt của khung hình cũng đã được thêm vào, điều này giúp quá trình xử lý tốn ít tài nguyên hơn. Logic cấp phép mới và thuận tiện hơn giúp nó có thể hoạt động trong các mạng kín (mạng nội bộ) bằng cách sử dụng khóa cứng bảo mật (USB hard key), có nghĩa là không cần internet. Trong trường hợp cài đặt theo nhóm, tất cả các thành phần của máy chủ đều truy cập vào một máy chủ cục bộ duy nhất.

Trong số những điểm ưu việt còn có:

  • khả năng tạo cái được gọi là danh sách đen và danh sách trắng dựa vào cơ sở dữ liệu sẵn có
  • nhóm các hình ảnh có cùng một khuôn mặt trong một “Cá nhân”. Vì vậy, bạn có thể tìm thấy tất cả hình ảnh của một người, được nhóm trong một “Person ID”
  • một máy chủ cấp phép cục bộ mới với giao diện web cho phép khách hàng kiểm soát các giới hạn của giấy phép đã mua tùy thuộc vào chức năng đã chọn và có tính đến các thông số khác nhau.

Phiên bản mới nhất của FindFace SDK chạy trên phiên bản mới nhất của thuật toán NtechLab — thuật toán đã được Viện Tiêu chuẩn và Công nghệ Quốc gia của Bộ Thương mại Hoa Kỳ (NIST) chứng nhận — và được thừa nhận là tốt nhất trên thế giới qua kết quả thử nghiệm.

Với câu hỏi NIST là gì, tại sao các nhà phát triển trên toàn thế giới gửi các thuật toán của họ đến đó, cách họ chuẩn bị để thử nghiệm và chứng chỉ NIST mang lại gì nếu bạn quyết định sử dụng tính năng nhận dạng khuôn mặt, chúng tôi sẽ cho bạn biết ở một trong những bài viết tiếp theo của mình. Hãy theo dõi và đừng quên đặt các câu hỏi liên quan đến chủ đề này.