Điều kiện tiên quyết để những thuật toán nhận dạng hành động ra đời

Lịch sử nhận dạng với sự trợ giúp của mạng lưới thần kinh (mạng nơ-ron) bắt đầu vào nửa sau của thế kỷ XX, chính xác hơn là từ thế kỷ XIX, khi nhà khoa học Santiago Ramón y Cajal lần đầu tiên mô tả cấu trúc của các tế bào thần kinh và những người nối tiếp ông đã cố gắng tái tạo cấu trúc này. Đọc thêm trong bài viết về các công nghệ dựa vào nhận dạng khuôn mặt.

Khi công nghệ phát triển, càng ngày nó càng nhận và giải quyết nhiều nhiệm vụ mới hơn, có thể kể đến như: nhận dạng nhiều hơn (số khuôn mặt trong khung hình), nhận dạng chính xác hơn, nhận dạng nhanh hơn. Đến năm 2015, mức độ toàn cầu của sinh trắc học khuôn mặt là khá cao. Tại cuộc thi thuật toán quốc tế, trong danh sách những đại diện hàng đầu nước Nga, NtechLab đã trình diễn kết quả tốt hơn so với cả Google và các công ty nổi tiếng khác.

Giờ đây, khi kết quả nhận dạng khuôn mặt với độ chính xác (lên đến 99%) và tốc độ (dưới 0,5 giây) như vậy, sẽ rất thích hợp để đặt ra câu hỏi rằng, công nghệ này sẽ còn được phát triển đến đâu nữa. Cuộc cạnh tranh sẽ tiếp tục khi tính đến từng phần của giây và phần trăm độ chính xác, nhưng những con số đạt được hiện nay đã cho phép chúng tôi giải quyết các vấn đề phức tạp nhất với hàng tỷ bộ dữ liệu và bao trùm các yêu cầu trong tất cả các trường hợp sử dụng, cả đối với an toàn công cộng cũng như đối với việc kinh doanh. Vậy tiếp theo sẽ là gì?

Những hướng phát triển của công nghệ nhận dạng

Các kỹ sư của chúng tôi từ cách đây vài năm đã bắt đầu tìm kiếm câu trả lời và đã tạo ra các thuật toán để nhận dạng hình bóng. Theo dõi hình bóng cũng là một tập hợp các tính năng độc đáo của con người, nó cho phép bạn phát hiện và đếm ngay lập tức hầu hết mọi người trong khu vực theo dõi, ngay cả những người quay lưng với camera, đồng thời có thể xây dựng các tuyến đường di chuyển của họ quanh thành phố dựa vào dữ liệu từ các máy ảnh.

Năm 2018, FindFace là một trong ba giải pháp giành chiến thắng trong cuộc thi phát hiện người đi bộ và đi xe đạp của Amazon. Và ngay sau đó, NtechLab tham gia cuộc thi quốc tế nhận dạng hành động do NIST tổ chức, hệ thống đã nhận dạng với độ chính xác cao 17 hành động khác nhau trong một luồng video, chẳng hạn như nói chuyện điện thoại, nhập tin nhắn văn bản, ra khỏi phương tin di chuyển, vận chuyển vật nặng và những hành động khác, và cuối dùng, đã giành giải vị trí thứ hai.

Trong cuộc thi, người tham gia được yêu cầu theo dõi lúc bắt đầu và kết thúc của một hành động trong một luồng video (stream video) thô và gửi thông tin đến cho ban tổ chức. Theo Artem Kukharenko, các kỹ sư đã xây dựng kiểu kiến trúc của mạng nơ-ron để sau quá trình đào tạo, thuật toán có thể nhận ra hầu hết mọi hành động trong luồng video.

Như các bạn thấy, những chiến lược gia của NtechLab đã nhìn thấy sự phát triển hơn nữa của các thuật toán nhận dạng sử dụng mạng thần kinh trong khả năng không chỉ nhận dạng một người mà còn hiểu các tuyến đường di chuyển của người đó, đánh giá hành động từ khía cạnh an toàn xã hội hoặc các tiêu chí khác, dự đoán tình huống nguy hiểm và loại bỏ chúng.

Nói cách khác, bên cạnh việc nhận dạng đối tượng thì việc phân tích video cũng mang lại giá trị rất lớn, nhờ phân tích này, chúng ta có thể giải quyết các vấn đề khác nhau có lợi cho doanh nghiệp, cho nhà nước và xã hội nói chung.

Các kịch bản áp dụng nhận dạng hành động

Nói về các kịch bản rõ ràng nhất cho việc sử dụng nhận dạng hành động, trước hết, cần phải đề cập đến việc ngăn ngừa các mối đe dọa đối với an toàn xã hội: theo dõi các tình huống xung đột mới bắt đầu. Điều quan trọng không kém là ghi lại các trường hợp, như khi có người để lại một đồ vật ở nơi công cộng và hệ thống sẽ ngay lập tức gửi thông báo đến các cơ quan hữu quan.

Tiếp theo là việc đảm bảo trật tự xã hội. Việc sử dụng công nghệ này sẽ giúp loại bỏ một cách hiệu quả việc hút thuốc lá ở nơi công cộng và sử dụng điện thoại di động khi lái xe.

Nhận dạng hành động cũng là một phương pháp hiệu quả để kiểm soát những nội dung không mong muốn, bởi nếu sử dụng con người, việc theo dõi sẽ cần nhiều thời gian, khó khăn và tốn kém hơn, đồng thời gây ra những ảnh hưởng tới tâm lý của nhân viên.

Chúng ta có thể tiếp tục một loạt kịch bản giám sát bằng một trường hợp dành cho các cơ sở y tế: thuật toán sẽ theo dõi việc thực hiện các quy tắc chăm sóc bệnh nhân, nó sẽ gửi thông báo ngay lập tức nếu một bệnh nhân bị ngã từ giường xuống đất trong bệnh viện.

Việc nhận dạng các hành động có triển vọng lớn để áp dụng trong các cơ sở công nghiệp, các nhà máy sản xuất độc hại và hơn thế nữa. NtechLab đã thảo luận về các phương án triển khai với nhiều công ty công nghiệp, năng lượng và dầu khí.

Vì vậy, nhận dạng hành động thực sự là nấc thang cao nhất trong sự phát triển của các thuật toán nhận dạng sử dụng mạng nơ-ron. Đây là một bước đột phá thực sự trong lĩnh vực này: công nghệ cho phép bạn sử dụng camera ngay cả với độ phân giải thấp và phát hiện hành động của cả những người không rõ khuôn mặt.

Ở thời điểm hiện tại, NtechLab là nhà phát triển nhận dạng hành động đoạt giải thưởng duy nhất ở Nga. Chúng tôi sẽ cập nhật cho bạn những phát triển mới nhất của ​​các kỹ sư từ phòng thí nghiệm.

Đăng ký nhận thông báo các bài đăng blog mới để cập nhật thông tin.