Tại sao Trí tuệ nhân tạo lại quan trọng đến vậy đối với các công nghệ bảo mật và nhận dạng hiện đại

Tại sao Trí tuệ nhân tạo lại quan trọng đến vậy đối với các công nghệ bảo mật và nhận dạng hiện đại

11/Jul/2023

Chia sẻ

#ACCESS CONTROL / IDENTITY / TRAVEL / PUBLIC SECURITY

Trí tuệ nhân tạo (AI) có tác động rất thực tế đến xã hội đương đại và chúng ta chỉ mới bắt đầu gặt hái những lợi ích—và giải quyết những thách thức liên quan. Các trường hợp sử dụng công nghệ AI ngày càng trở nên phổ biến hơn khi các thuật toán học sâu giúp chúng ta giải quyết các vấn đề ngày càng phức tạp. Được áp dụng cho các lĩnh vực nhận dạng và bảo mật, những công nghệ này đã thúc đẩy tiến bộ vượt bậc trong thập kỷ qua—tiến trình không thể thực hiện được nếu không có sự giám sát của con người.

AI là gì… và nó không phải là gì

Công nghệ AI: tách huyền thoại khỏi thực tế

Hãy làm rõ một điểm khác biệt quan trọng: AI cho phép máy tự học nhưng không thể huấn luyện máy tự suy nghĩ. Vì vậy, chính xác những gì chúng ta có nghĩa là thông minh? Nếu chúng ta quay trở lại với gốc Latinh của nó, thì trí thông minh là khả năng hiểu biết—một khả năng chỉ có ở con người và không thể tách rời khỏi khả năng suy nghĩ của họ. Dù hiệu suất của một số ứng dụng AI gần đây có thể đáng lo ngại, nhưng chúng ta nên cẩn thận để không đi đến kết luận rằng trí tuệ con người và trí tuệ nhân tạo là một.

Thuật ngữ 'trí tuệ nhân tạo' có từ những năm 1950, khi các chuyên gia bị thu hút bởi sự phát triển nhanh chóng của máy tính. Trong nhiều thập kỷ, những gì được coi là 'máy thông minh' trên thực tế là các chương trình máy tính phức tạp cho phép máy tính thực hiện các tác vụ được lập trình sẵn, chẳng hạn như chơi cờ vua. Mặc dù chúng đã mang tính đột phá vào thời điểm đó, nhưng những chiếc máy tính này vẫn còn lâu mới trở thành nguồn cung cấp trí thông minh thực sự—hay sự hiểu biết.

Ngày nay, các công nghệ AI học hỏi bằng cách rà soát hàng loạt dữ liệu và rút ra kết luận dựa trên các mẫu định kỳ. Bằng cách này, họ cung cấp cho con người những hiểu biết sâu sắc nhưng họ vẫn thiếu khả năng suy nghĩ – và hiểu – những kết luận của chính họ.

Để tìm hiểu và đưa ra kết luận, máy móc sử dụng thuật toán (tức là hướng dẫn từng bước) để hoàn thành một nhiệm vụ chính xác, trong khuôn khổ được xác định trước và để đáp ứng một nhu cầu cụ thể. Để trở thành một nguồn hiểu biết (và trí thông minh) thực sự, việc học này chỉ có thể đạt được khi có sự hợp tác của con người—không bao giờ chỉ bằng máy móc.

Cuối cùng, nguồn thông minh thực sự vẫn là con người. Chính trí thông minh của con người đầu tiên hiểu được vấn đề cần giải quyết và thiết kế khuôn khổ để thực hiện điều này. Cũng chính trí thông minh của con người sau đó có thể rút ra bài học từ quá trình học tập và những phát hiện do máy móc tạo ra. Trên thực tế, trí tuệ nhân tạo thực sự là một phần mở rộng của trí thông minh con người chứ không phải là một dạng trí thông minh tự thân.

Nói tóm lại, các công nghệ AI là một công cụ tuyệt vời để hỗ trợ trí thông minh của con người. Chúng mở đường cho tự động hóa và đưa ra quyết định nhanh hơn, nhưng sự giám sát của con người là và sẽ luôn là không thể thiếu.

Công nghệ đằng sau khái niệm

Học máy là công nghệ cốt lõi đằng sau AI. Nó bao gồm việc dạy máy tính tự động tìm kiếm thông tin trong các bộ dữ liệu. Sau khi một máy được đưa ra một ví dụ, nó có thể sàng lọc dữ liệu, tìm các mẫu và mối tương quan dựa trên những gì nó đã học được. Khi máy bắt đầu đưa ra kết luận đúng, máy có thể áp dụng những kiến ​​thức này cho các tập dữ liệu mới. Thuật toán thích ứng và cải thiện theo thời gian khi nó xử lý nhiều dữ liệu hơn.

Mặt khác, học sâu là một tập hợp con của học máy. Nó bắt chước kiến ​​trúc mạng lưới thần kinh của bộ não con người. Không giống như học máy, mạng lưới thần kinh học sâu dựa trên một số lớp xử lý (đó là nơi “sâu” bắt nguồn) để xác định các mẫu, phân loại thông tin hoặc nhận dạng giọng nói, hình ảnh, v.v. Thay vì dựa vào một ví dụ, các thuật toán học sâu xử lý đáng kinh ngạc số lượng dữ liệu thô để tìm hiểu và cải thiện.

Sự thay đổi mô hình học tập sâu

Trong những năm gần đây, các thuật toán học sâu đã cho phép công nghệ AI thâm nhập vô số thị trường và ngành công nghiệp. Ngày nay, bạn sẽ khó tìm được một lĩnh vực—hoặc thậm chí là một người—không dựa vào các giải pháp AI cho một số khía cạnh của hoạt động kinh doanh hoặc cuộc sống hàng ngày của họ. Nhưng điều gì đã châm ngòi cho sự gia tăng này? Phần lớn, thói quen tiêu dùng của chính chúng ta đã đẩy deep learning lên hàng đầu. Các thiết bị được kết nối, thành phố thông minh, IoT nói chung và thói quen trực tuyến của chúng ta—tất cả những tiến bộ công nghệ này tạo ra vô số dữ liệu chi tiết từ một nhóm nguồn vô cùng đa dạng. Lượng dữ liệu lớn này, kết hợp với sự gia tăng rõ rệt về sức mạnh máy tính, bắt đầu từ những năm 1980, các thuật toán và công nghệ tiên tiến hơn đã đủ trưởng thành vào đầu những năm 2010, đã mở ra một cách học hiệu quả hơn.

Khả năng sắp xếp thông qua lượng dữ liệu khổng lồ do học sâu mang lại, giúp tăng hiệu suất theo cấp số nhân: giờ đây các vấn đề có thể được lập mô hình với hàng triệu tham số, đào sâu quá trình học tập và cung cấp câu trả lời cho các vấn đề phức tạp hơn bao giờ hết. Việc thực hiện các nhiệm vụ như nhận dạng hình dạng hoặc hiểu lời nói đã trở nên hiệu quả đáng kinh ngạc, thúc đẩy toàn bộ miền trong quá trình này.

Tại sao các thuật toán AI ngày nay lại hiệu quả đến vậy?

Sức mạnh của công nghệ học sâu

Con người thường có thể bị choáng ngợp bởi khối lượng dữ liệu khổng lồ và chỉ có thể khai thác một phần hữu hạn—khiến các kho dữ liệu lớn không được sử dụng. Mặt khác, công nghệ học sâu có khả năng mở rộng rất lớn. Theo thiết kế, mạng nơ-ron của học sâu trở nên hiệu quả hơn với việc bổ sung các nơ-ron mới. Điều này có nghĩa là máy móc có thể hấp thụ một lượng dữ liệu mới vô hạn. Thay vì đạt đến mức bão hòa, làn sóng dữ liệu thực sự cải thiện hiệu suất. Khi mạng phát triển, hiệu suất tăng lên và các mô hình có thể xử lý các vấn đề ngày càng phức tạp hơn. Học sâu cũng là một quá trình lặp đi lặp lại—nghĩa là nó là một hệ thống năng động, tự thực hiện, liên tục điều chỉnh theo dữ liệu mới để tìm ra câu trả lời tốt hơn. Đây là một cách khác mà deep learning bắt chước trí óc con người—giống như chúng ta, các thuật toán deep learning cải thiện theo kinh nghiệm. Nhưng sự so sánh kết thúc ở đó.

Tầm quan trọng của dữ liệu (chính xác)

Công nghệ học sâu yêu cầu rất nhiều dữ liệu—bảng dữ liệu càng lớn thì càng tốt. Nhưng không chỉ bất kỳ dữ liệu. Việc thu thập dữ liệu cần phải chính xác và không có lỗi để đảm bảo rằng kết quả là chính xác và không thiên vị. Nó cũng cần phải phù hợp, có nghĩa là dữ liệu phải có nguồn gốc mà không làm mất tầm nhìn của vấn đề hiện tại. Nói cách khác, cần phải hiểu các ứng dụng để phát triển các công cụ công nghệ cho phù hợp. Tầm quan trọng của dữ liệu đã tăng vọt trong những năm gần đây—khiến dữ liệu trở thành lợi thế cạnh tranh thực sự cho những ai tìm nguồn và sử dụng dữ liệu đúng cách. Phần cuối cùng đó rất cần thiết—trên hết, dữ liệu là một nguồn tài nguyên quý giá phải được bảo vệ. Điều đó có nghĩa là một khuôn khổ rõ ràng liên quan đến đạo đức đằng sau cách thức thu thập, lưu trữ và sử dụng dữ liệu là vô cùng quan trọng, đặc biệt là xem xét việc sử dụng dữ liệu đã và sẽ tiếp tục phát triển như thế nào trong những năm qua.

Giải pháp AI giúp con người như thế nào

AI, một đồng minh thiết yếu

Mặc dù khái niệm về AI được lấy cảm hứng từ trí óc con người, nhưng các thuật toán học sâu thực sự nhìn thấy các mẫu dễ dàng hơn chúng ta, do đó giúp giảm bớt quá trình ra quyết định và tạo điều kiện tự động hóa mà không gây mệt mỏi. AI có thể vừa xử lý các tác vụ nằm ngoài phạm vi của máy tính truyền thống, vừa có thể hoàn thành các tác vụ tẻ nhạt, tốn thời gian nhanh hơn và nhất quán hơn so với con người. Cụ thể, các giải pháp AI giúp cải thiện khả năng dự đoán, phát hiện và sắp xếp trên tất cả các lĩnh vực—ví dụ: phát hiện và nhận dạng đối tượng—do đó giải phóng thời gian quý báu mà sau đó có thể dành cho các nhiệm vụ giá trị gia tăng đòi hỏi trí thông minh của con người.

Những lợi thế của công nghệ AI là không thể nhầm lẫn khi phân tích các nhóm dữ liệu lớn. Từ việc phân tích các tuyến đường và xác định các mẫu để nâng cao hiệu quả và trải nghiệm người dùng trong ngành vận tải; sàng lọc dữ liệu thiết bị đeo được để cải thiện việc chăm sóc và chẩn đoán bệnh nhân trong lĩnh vực y tế; hoặc cá nhân hóa trải nghiệm tiếp thị và mua sắm trong lĩnh vực bán lẻ—các trường hợp sử dụng AI sáng tạo đang mở rộng trong các ngành và lĩnh vực. Các tổ chức tài chính và cơ quan chính phủ cũng dựa vào các giải pháp AI để phát hiện gian lận và bảo vệ người dân cũng như doanh nghiệp. Được hỗ trợ bởi thông tin chi tiết do AI tạo ra, những người ra quyết định được trang bị tốt hơn để đưa ra quyết định đúng đắn.

Cách thuật toán AI giúp loại bỏ sai lệch

Có rất nhiều cuộc nói chuyện về sự thiên vị trong sinh trắc học. Xét cho cùng, trong cộng đồng khoa học, có cả một lĩnh vực nghiên cứu, “sự công bằng trong các hệ thống máy học”, dành riêng cho việc đo lường, hiểu và giảm thiểu các vấn đề về thành kiến. Nhưng trên thực tế, sự thiên vị phổ biến hơn nhiều trong bản chất con người và trong xã hội nói chung hơn là trong các thuật toán cân bằng và chính xác. Trên thực tế, các thuật toán ngày nay đưa ra một giải pháp khả thi cho vấn đề trong thế giới thực này. Điều quan trọng cần nhớ là các giải pháp AI phải luôn được kết hợp với phân tích và quyết định của con người. Trong trường hợp cơ quan thực thi pháp luật, tư pháp hoặc biên giới sử dụng công nghệ AI, quyết định cuối cùng luôn thuộc về những người đã tuyên thệ nhậm chức và được pháp luật ủy quyền thực hiện cuộc gọi. Công nghệ AI chỉ là hỗ trợ để con người hoàn thành công việc, tăng tốc độ, đồng thời giảm nguy cơ sai sót.

Ngành công nghiệp nhận dạng và bảo mật đã đi một chặng đường dài trong việc giảm thiểu sự thiên vị trong nhận dạng sinh trắc học. Đáng chú ý, trong vài năm qua, thử nghiệm độc lập do Viện Tiêu chuẩn và Công nghệ Quốc gia (NIST) thực hiện đã chỉ ra rằng sự khác biệt về hiệu suất của các thuật toán nhận dạng sinh trắc học giữa các nhóm nhân khẩu học có thể giảm đến mức hầu như không thể phát hiện được. Công nghệ nhận dạng khuôn mặt AI tốt nhất trong lớp nổi bật trong các thử nghiệm này bằng cách kết hợp tính công bằng và chính xác.

Điều quan trọng cần lưu ý là để đạt được sự cân bằng đó, các thuật toán này không tự học sau khi được triển khai—con người giữ quyền kiểm soát hiệu suất của chúng. Các nhà phát triển đo lường tỷ lệ lỗi của các thuật toán trên các nhóm khác nhau, áp dụng các biện pháp khắc phục và đảm bảo tính công bằng vẫn là tiêu chí chính.

Với khả năng xác định tất cả các đối tượng tốt như nhau, bất kể nhân khẩu học, các công nghệ AI được phát triển một cách có trách nhiệm và đạo đức thực sự có thể giúp con người giảm nguy cơ bị phân biệt đối xử.

Học sâu thúc đẩy các công nghệ bảo mật và nhận dạng như thế nào?

sinh trắc học

Những tiến bộ trong AI đã cách mạng hóa lĩnh vực sinh trắc học. Khả năng mô hình hóa các vấn đề phức tạp hơn và xử lý nhiều dữ liệu nhanh hơn nhiều đã nâng cao tiêu chuẩn đáng kể về hiệu suất và độ chính xác. Đối với những người mới bắt đầu, lượng dữ liệu khổng lồ có sẵn kết hợp với khả năng tính toán do học sâu mang lại giúp các thuật toán sinh trắc học trở nên chính xác hơn bao giờ hết. Mặc dù nhận dạng khuôn mặt có lẽ là ví dụ điển hình nhất về tác động của AI đối với sinh trắc học, nhưng học sâu cũng đã thúc đẩy những tiến bộ trong công nghệ vân tay và cũng chỉ mới bắt đầu chạm đến bề mặt trong lĩnh vực công nghệ mống mắt.

Trong những ngày đầu của thuật toán nhận dạng khuôn mặt, chỉ có thể xác định khuôn mặt khi được đặt ngay trước thiết bị đầu cuối sinh trắc học. Tiến bộ trong lĩnh vực này, chủ yếu do AI tăng hiệu quả, đã cải thiện trải nghiệm người dùng.

Công nghệ nhận dạng khuôn mặt AI ngày nay yêu cầu rất ít người dùng trong khi danh tính của họ được xác minh—quá trình này nhanh hơn, hiệu quả hơn và dễ dàng hơn. Ví dụ: khuôn mặt của người dùng có thể được phân tích chính xác cho dù họ đang di chuyển hay tĩnh, đeo kính hay đang cười, đối mặt với thiết bị đầu cuối sinh trắc học hay nhìn sang hướng khác. Các thuật toán AI thậm chí có thể đạt được khả năng phát hiện sự sống mà không yêu cầu đối tượng thực hiện bất kỳ tư thế hoặc chuyển động cụ thể nào. Phát hiện sự sống—hoặc khả năng xác nhận rằng trên thực tế, khuôn mặt hoặc dấu vân tay được phân tích thực sự được trình bày trực tiếp bởi chủ sở hữu thực của chúng (so với ảnh, mặt nạ silicon hoặc dấu vân tay giả mạo)—cải thiện đáng kể hệ thống chống gian lận.

Khi nói đến sinh trắc học dấu vân tay, công nghệ học sâu cho phép đọc dấu vân tay bị hỏng hoặc xác minh chính xác danh tính thông qua hệ thống kiểm soát truy cập hoàn toàn không tiếp xúc.

Kiểm soát truy cập không ma sát

Các hệ thống kiểm soát truy cập ngày nay cũng có thể dựa vào dữ liệu sinh trắc học khuôn mặt để xác định khách và nhân viên từ xa khi họ bước vào tòa nhà. Các thuật toán nâng cao có thể tạo ra trải nghiệm nhận dạng sinh trắc học thực sự liền mạch bằng cách cho phép nhận dạng chuyển động trong khi vẫn đảm bảo độ chính xác cao nhất. Sức mạnh đằng sau công nghệ này nằm ở khả năng phân tích toàn bộ tình huống xung quanh các điểm truy cập của thuật toán AI, cho phép truy cập theo nhóm và đồng thời phát hiện các hành vi đáng ngờ.

Và khi thế giới nói chung ngày càng hướng tới các phương pháp không tiếp xúc, thì lĩnh vực kiểm soát truy cập cũng vậy. Nói một cách đơn giản, sử dụng hệ thống nhận dạng khuôn mặt AI có nghĩa là không cần tiếp xúc trực tiếp với thiết bị kiểm soát truy cập, một giải pháp thay thế hợp vệ sinh hơn nhiều trong điều kiện hậu đại dịch.

Xác thực tài liệu

Một ví dụ thực tế khác về công nghệ học sâu tại nơi làm việc là xác minh một lượng lớn tài liệu—bao gồm hộ chiếu, bằng lái xe, thị thực, giấy tờ nhập cư, tài liệu thuế, thẻ cử tri, v.v. Các thuật toán học sâu có thể phát hiện tài liệu được đặt trên máy quét hoặc phía trước camera điện thoại, xác định loại tài liệu, đọc văn bản và hình ảnh cũng như đảm bảo tính xác thực—ví dụ: xác minh rằng đó không phải là tài liệu giả hoặc bản sao. Điều này có nghĩa là phân tích phông chữ, các tính năng bảo mật như hình ba chiều, hình mờ và mã vạch, đồng thời có thể xác định thao tác hình ảnh, giả mạo pixel, giả mạo kỹ thuật số và các loại giả mạo khác. Ở đây, AI là một nguồn tài nguyên vô giá—xác minh đồng thời tất cả các tính năng bảo mật của tài liệu một cách hiệu quả hơn, nhanh chóng hơn và an toàn hơn bao giờ hết. Trí tuệ nhân tạo có thể đạt được tất cả những điều đó trên vô số tài liệu, thậm chí từ xa—một nhiệm vụ mà ngay cả bộ óc con người được đào tạo bài bản nhất cũng không thể cạnh tranh được.

Các ứng dụng nhận dạng và bảo mật của AI trong cuộc sống hàng ngày là gì?

Cho dù bạn có biết hay không, AI đang hoạt động trong nhiều lĩnh vực khác nhau của cuộc sống hàng ngày—dành cho các công ty, chính phủ cũng như người dùng cuối. Bằng cách cải tiến sinh trắc học, phân tích hình ảnh và hệ thống chống gian lận, các giải pháp AI giúp bảo vệ danh tính, hợp lý hóa quy trình xác minh và giúp thế giới vận hành trơn tru hơn một chút.

Xác minh danh tính và phát hiện gian lận trong mọi môi trường

Trí tuệ nhân tạo hiện diện trong mọi loại xác minh danh tính nâng cao và tình huống phát hiện gian lận—cả trực tiếp và trực tuyến:

  • Trực tuyến Biết khách hàng của bạn tuân thủ đối với các nhà khai thác di động, tổ chức tài chính, các lĩnh vực được quản lý, v.v.
  • Truy cập an toàn vào các dịch vụ điện tử của chính phủ, y tế, giáo dục, v.v.
  • Kiểm soát truy cập cho nhà ở tư nhân, tòa nhà văn phòng và các địa điểm công nghiệp nhạy cảm
  • Cải thiện trải nghiệm người dùng, luồng hành khách và kiểm soát biên giới trong mọi môi trường du lịch—dù bằng đường hàng không, đường bộ hay đường biển.

Một ví dụ cụ thể về deep learning trong quá trình ra quyết định là trong bối cảnh tạo thuận lợi cho luồng hành khách. Ở đây, toàn bộ chuỗi thuật toán AI được yêu cầu ở tất cả các giai đoạn của quy trình xác minh danh tính tự động. Bước đầu tiên là phát hiện và theo dõi. Ví dụ: hiểu tất cả các yếu tố trong nguồn cấp dữ liệu video eGate hoặc định vị mống mắt trên khuôn mặt của một người. Tiếp theo là đánh giá chất lượng, tìm ra những hình ảnh tốt nhất để sử dụng cho mục đích sinh trắc học. Sau đó, xây dựng một mẫu sinh trắc học, tức là trích xuất thông tin liên quan từ hình ảnh. Cuối cùng là nhận dạng hoặc khớp với dữ liệu tương tự. Trong ví dụ này, các thuật toán học sâu xác nhận danh tính của hành khách khi họ quét hộ chiếu khi làm thủ tục lên máy bay và khi họ bước vào trước camera tại một cổng điện tử để kiểm tra sinh trắc học lần cuối trước khi lên máy bay.

Tóm lại, AI so sánh hình ảnh hộ chiếu (và xác minh rằng ảnh không bị giả mạo) với hình ảnh trực tiếp để xác định rằng người đó chính là người mà họ nói—tất cả chỉ trong vòng vài giây.

Phân tích dữ liệu thông minh để tăng cường an toàn

Mặc dù khung pháp lý liên quan đến việc sử dụng AI để đảm bảo an toàn công cộng đặt ra các câu hỏi đạo đức hợp pháp xung quanh từ này—và sẽ tiếp tục phát triển, các giải pháp AI đã và sẽ tiếp tục cực kỳ hữu ích trong các tình huống rất chính xác. Thứ nhất, trong việc xác định nạn nhân của tội phạm; thứ hai, trong việc tìm kiếm những người bị kết án hoặc bị tình nghi phạm tội nghiêm trọng; và cuối cùng, trong trường hợp có mối đe dọa an toàn công cộng nghiêm trọng hoặc ngay lập tức. Trong những tình huống này, AI có thể được sử dụng để tự động trích xuất khuôn mặt hoặc phương tiện hoặc các đối tượng khác xuất hiện trong cảnh quay video và gửi cảnh báo tự động khi tìm thấy. Nó có ý nghĩa của tất cả các dữ liệu có sẵn; tiết kiệm thời gian, nguồn lực và tiền bạc—đồng thời giảm lỗi của con người.

Đạo đức và trách nhiệm xã hội gắn bó chặt chẽ với công nghệ AI như thế nào

Công nghệ rất tuyệt nhưng cách bạn sử dụng nó mới quan trọng

Bản thân công nghệ không tốt hay xấu, tất cả nằm ở cách bạn áp dụng nó. Ví dụ, trong ngành nhận dạng và bảo mật—nơi mọi người sử dụng máy móc để xác minh danh tính bằng cách dựa vào dữ liệu sinh trắc học—đạo đức là một yếu tố cực kỳ quan trọng. Để giảm bớt những lo ngại chính đáng của công chúng và tạo niềm tin, ngành phải thận trọng và tự chịu trách nhiệm khi áp dụng các công nghệ đột phá này. Phải áp dụng nghiêm ngặt những việc nên làm và không nên làm. Ví dụ, sự giám sát của con người là cần thiết. Mặc dù các công nghệ AI đã cho phép ngành công nghiệp phát triển vượt bậc, nhưng chúng ta không thể quên rằng có sự khác biệt thực sự giữa máy móc và con người. Chính phủ và các bên thứ ba cũng đã can thiệp để tạo ra các khung pháp lý nhằm đảm bảo việc sử dụng công nghệ có trách nhiệm.

Nuôi dưỡng niềm tin bằng cách kiểm soát máy

triển khai một quy trình công nghiệp với các bài kiểm tra và xác nhận, theo từng bước, là một phần quan trọng trong việc phát triển các công nghệ dựa trên các thuật toán học sâu. Ví dụ, cách mà máy học luôn phải được giám sát bởi con người. Và mặc dù việc cải thiện hiệu suất là quan trọng, nhưng điều quan trọng là phải xác định và sửa chữa những sai lệch tiềm ẩn—một nhiệm vụ rất phức tạp, nhưng dù sao cũng là một phần quan trọng của công việc.

Hiệu chỉnh sai lệch hiện là một tiêu chí về chất lượng và hiệu suất

Trong những năm gần đây, cách đánh giá hiệu suất đã có sự thay đổi rõ rệt—đáng chú ý là Viện Tiêu chuẩn và Công nghệ Quốc gia (NIST) đã đưa biện pháp kiểm soát hiệu chỉnh sai lệch vào các đánh giá điểm chuẩn sinh trắc học khuôn mặt kể từ năm 2019(1). Điều này có nghĩa là việc điều chỉnh sai lệch không chỉ có thể thực hiện được , nhưng nó cũng là một tiêu chí định tính khi đánh giá hiệu suất của thuật toán nhận dạng khuôn mặt AI. Xét cho cùng, dữ liệu tạo ra một lợi thế rất lớn, nhưng nó cũng có giới hạn của nó. Ví dụ, nếu tập dữ liệu không đủ đại diện, nó có thể dẫn đến sai lệch. Điều này xảy ra trong những ngày đầu của deep learning (một số thử nghiệm deep learning ban đầu rơi vào cái bẫy của thành kiến ​​giới tính hoặc dân tộc). Những sai lầm này đã được sửa chữa. Ngày nay, một cơ sở dữ liệu có thể được phân tích thông qua số liệu thống kê, cho phép nó phát hiện sự mất cân bằng tiềm ẩn trong tập dữ liệu và sau đó cân bằng lại nó.

Một ví dụ khác về sự can thiệp của con người là khi các lập trình viên và kỹ sư nhận ra tầm quan trọng tuyệt đối của việc có được hình ảnh chất lượng cao với mọi tông màu da trong mọi điều kiện ánh sáng. Để tránh thiên vị. Với sự trợ giúp của AI, họ đã tạo ra một vòng điều khiển để tối ưu hóa mức tăng và điều chỉnh màn trập máy ảnh để đảm bảo chất lượng hình ảnh như nhau bất kể màu da. Một cách khác để loại bỏ sai lệch là làm việc trực tiếp với số lượng hình ảnh và danh tính trên mỗi nhóm trong tập dữ liệu học tập.

Sử dụng dữ liệu ẩn danh để bảo vệ quyền riêng tư

Với những lo ngại ngày càng tăng xung quanh việc bảo vệ quyền riêng tư, điều quan trọng cần lưu ý là các bên có trách nhiệm trong lĩnh vực này cam kết bảo vệ quyền riêng tư của người dùng cuối bằng cách chỉ sử dụng cơ sở dữ liệu ẩn danh để đào tạo các thuật toán AI. Từ quan điểm công nghệ, khi đào tạo một thuật toán để nhận dạng khuôn mặt, không cần phải gán dữ liệu sinh trắc học cho một người cụ thể— thuật toán chỉ cần các bức ảnh của cùng một khuôn mặt từ các góc độ khác nhau, trong các điều kiện ánh sáng khác nhau, với các phụ kiện hoặc kiểu tóc khác nhau, hoặc ở các độ tuổi khác nhau. Nói cách khác, người dùng chỉ cần câu trả lời từ hệ thống chứ không cần dữ liệu thực tế được các thuật toán AI sử dụng trong quá trình ra quyết định.

Để dập tắt mọi lo ngại còn sót lại, các cơ quan có thẩm quyền và các quy định về quyền riêng tư như GDPR ở Châu Âu đã được thiết lập để xác định các hướng dẫn rõ ràng cho việc thu thập và sử dụng dữ liệu cũng như để đảm bảo tuân thủ.

Suy nghĩ về AI về phía trước—điều gì tiếp theo cho các công nghệ nhận dạng và bảo mật?

Tương lai của dữ liệu

Với làn sóng công nghệ tiếp tục phát triển, có thể nói rằng khối lượng dữ liệu sẽ chỉ tiếp tục tăng theo cấp số nhân. Điều đó có nghĩa là có một lượng lớn dữ liệu chưa được gắn nhãn được tạo ra mỗi giây mỗi ngày—dữ liệu chưa được sử dụng hết tiềm năng của nó. Sự thay đổi về khối lượng dữ liệu này chắc chắn sẽ tiếp tục cung cấp năng lượng cho các mô hình AI và các trường hợp sử dụng trong tương lai.

Sự thay đổi sắp xảy ra là chuyển từ học có giám sát (chỉ sử dụng dữ liệu được gắn nhãn) sang học bán giám sát (sử dụng dữ liệu được gắn nhãn và dữ liệu không được gắn nhãn), giám sát yếu (sử dụng nhãn gián tiếp) hoặc thậm chí là học không giám sát (chỉ sử dụng dữ liệu không được gắn nhãn). Những kỹ thuật này cho phép tăng mức sử dụng dữ liệu ngay cả khi nhãn không có sẵn hoặc quá khó sản xuất. Nhưng hãy nói rõ rằng, cho dù dữ liệu có được gắn nhãn hay không, quá trình học hỏi – và việc đo lường hiệu suất của nó – sẽ vẫn nằm dưới sự giám sát của con người.

Giải thích AI

Chúng tôi đang bắt đầu hiểu những gì diễn ra bên trong mạng lưới thần kinh; một quá trình sẽ tiếp tục phát triển trong những năm tới. Ngày nay, các chuyên gia AI đang tìm hiểu sâu hơn về cách các thuật toán học sâu đạt được kết luận như chúng, đặc biệt là khi chúng không đạt được kết quả như mong đợi. Điều đó nói rằng, điều quan trọng cần nhớ là mặc dù thuật toán cho phép máy tự học, nhưng nó cũng được hỗ trợ bởi một quy trình công nghiệp. Con người vẫn có nhiệm vụ cực kỳ quan trọng là xác thực, kiểm tra, đo lường kết quả và làm bất cứ điều gì cần thiết để đảm bảo độ chính xác của thuật toán. Con người chúng ta không thể đơn giản phát triển công nghệ và “thả lỏng nó”.

Cam kết của IDEMIA khi làm việc với công nghệ AI

Tại IDEMIA, AI không chỉ là công cụ để phân tích dữ liệu kinh doanh hay tối ưu hóa hoạt động hậu cần như ở nhiều công ty khác, mà là cốt lõi của các giải pháp chúng tôi phát triển. Chính xác hơn, chúng tôi sử dụng nó để cho phép hệ thống của chúng tôi lấy được thông tin có ý nghĩa từ đầu vào trực quan và hành động hoặc đưa ra đề xuất phù hợp.

Tuân thủ dữ liệu và các quy định về quyền riêng tư

Đầu tiên và quan trọng nhất, IDEMIA nhận ra bản chất nhạy cảm của tất cả các cá nhân. Chúng tôi cam kết bảo vệ dữ liệu, không chỉ khi đào tạo các thuật toán AI và phát triển các giải pháp mà còn khi các giải pháp của chúng tôi được sử dụng trong lĩnh vực này. Chúng tôi cho rằng việc đảm bảo rằng các giải pháp của chúng tôi không thể bị tấn công, can thiệp hoặc phá vỡ là vô cùng cần thiết. Để đạt được mục tiêu này, chúng tôi đặc biệt chú ý đến cách dữ liệu được xử lý và các quy định áp dụng. Trên thực tế, rất lâu trước khi có quy định GDPR, chúng tôi đã thiết lập các quy trình và cơ sở hạ tầng của riêng mình để quản lý dữ liệu cá nhân một cách an toàn—các quy trình này hiện cũng tuân thủ các quy định về quyền riêng tư như GDPR ở Châu Âu, quy định về quyền riêng tư của Hoa Kỳ hoặc quy định tương đương ở các khu vực khác.

Dữ liệu được thu thập và sử dụng như thế nào

Để tạo ra các thuật toán chính xác nhất, chúng tôi cần liên tục truy cập nhiều dữ liệu hơn—một cách có trách nhiệm. Chúng tôi thu thập dữ liệu từ khách hàng, tuân thủ các quy định về quyền riêng tư có liên quan, để huấn luyện các thuật toán của họ và cung cấp các sản phẩm cũng như giải pháp hiệu suất cao. Chúng tôi cũng dựa vào dữ liệu được nhân viên của mình chia sẻ trên cơ sở tự nguyện để xây dựng cơ sở dữ liệu của chúng tôi hàng năm. Cuối cùng, chúng tôi tạo hình ảnh tổng hợp bằng cách sử dụng Mạng đối thủ chung (GAN). Điều này cho phép chúng tôi tạo ra các hình ảnh khuôn mặt và dấu vân tay tổng hợp định tính hoàn toàn hư cấu. Vì vậy, khi khách hàng yêu cầu chúng tôi chia sẻ dữ liệu để kiểm tra hiệu quả của thuật toán, chúng tôi có thể chia sẻ dữ liệu tổng hợp của mình.

Tận dụng chuyên môn của chúng tôi về mật mã để bảo vệ dữ liệu và hệ thống

Là người đi đầu trong lĩnh vực của mình, chúng tôi cam kết tạo ra các giải pháp bảo vệ dữ liệu cá nhân và đảm bảo dữ liệu đó không thể và sẽ không bị lạm dụng. Để làm như vậy, chúng tôi áp dụng kiến ​​thức chuyên môn của mình về kỹ thuật mã hóa và quyền quản lý quyền truy cập để thiết kế cơ sở dữ liệu theo cách cho phép người dùng được ủy quyền tìm kiếm cơ sở dữ liệu cho một người cụ thể mà không cần cấp cho họ quyền truy cập vào danh sách những người trong cơ sở dữ liệu đó. Điều đó có nghĩa là không ai có thể trích xuất dữ liệu cá nhân—không phải IDEMIA, khách hàng của chúng tôi, chính phủ hoặc bất kỳ ai có thể cố gắng xâm nhập. Hơn nữa, bất cứ khi nào có thể, chúng tôi thiết kế các giải pháp và hệ thống để đảm bảo rằng dữ liệu cá nhân chỉ được giữ bởi cá nhân của họ chủ sở hữu—ví dụ: được mã hóa trong thành phần bảo mật của tài liệu, thẻ thông minh hoặc điện thoại thông minh.

Khi công nghệ và kỹ thuật mật mã tiếp tục phát triển, chúng tôi tiếp tục đầu tư vào những cách mới để bảo vệ dữ liệu cá nhân hơn nữa và đảm bảo quyền truy cập hạn chế vào dữ liệu đó.

Đảm bảo tính toàn diện thực sự

Ngày nay, chúng tôi có thể tự hào nói rằng các thuật toán học sâu của chúng tôi hiệu quả đến mức khó có thể đo lường được độ lệch—một khẳng định táo bạo và hiếm có không kém trong ngành của chúng tôi. Nhưng đây không phải là nhiệm vụ nhỏ! Các nhóm tận tâm của chúng tôi là những chuyên gia trong quy trình phức tạp chuẩn bị dữ liệu đào tạo và điều chỉnh cách thuật toán học trên một tập dữ liệu nhất định. Họ cũng đảm bảo rằng cơ sở dữ liệu của chúng tôi chứa nhiều hình ảnh của cùng một thành phần trong các điều kiện thu thập khác nhau để đảm bảo tính toàn diện thực sự.

Sử dụng có đạo đức các công nghệ AI: một cách tiếp cận tập thể

Mọi người trong hệ sinh thái phải thực hiện phần việc của mình để bảo vệ người dùng. Điều này bao gồm những người chơi công nghiệp như IDEMIA, các nhóm làm việc trong nước và quốc tế và các nhóm chuyên gia tư vấn, các học giả, cơ quan quản lý và khách hàng sử dụng công nghệ. Trong những năm qua, IDEMIA đã định vị mình là một đối tác đặc quyền trong hệ sinh thái AI của Pháp. Chúng tôi hợp tác chặt chẽ với CNIL và Cơ quan Nghiên cứu Quốc gia Pháp; tham gia các hội thảo do Dự án Nhận dạng Khuôn mặt của Diễn đàn Kinh tế Thế giới tổ chức; hỗ trợ hệ sinh thái học thuật bằng cách làm việc với một số chủ tịch nghiên cứu cấp cao, đặc biệt là về AI. Hơn nữa, chúng tôi coi trọng việc phân tích cẩn thận cách khách hàng có thể sử dụng các giải pháp AI của chúng tôi và chỉ hợp tác với những người tuân thủ các tiêu chuẩn đạo đức của chúng tôi.

Trong bối cảnh quốc tế ngày càng cạnh tranh, chúng tôi kêu gọi các quy định nghiêm ngặt về việc thu thập dữ liệu cho mục đích nghiên cứu nhằm tuân thủ các tiêu chuẩn đạo đức, đồng thời hỗ trợ khả năng cạnh tranh của ngành. Trong tương lai, chúng tôi cũng có kế hoạch tiếp tục khám phá các con đường khác—chẳng hạn như tạo nhãn cho “nhà cung cấp đáng tin cậy” ở cấp độ Châu Âu chẳng hạn. Khi chúng tôi xem xét rằng nhận dạng khuôn mặt AI có thể được sử dụng trong các bối cảnh khác nhau của chính phủ (ví dụ: kiểm soát biên giới), việc đảm bảo nguồn gốc của công nghệ không chỉ là yếu tố chính của chủ quyền quốc gia mà còn đặt ra câu hỏi về hiệu suất, phương pháp, đạo đức và hơn. Chúng tôi cho rằng cần thiết phải có một cấu trúc có thể giúp khách hàng bình tĩnh lựa chọn giải pháp công nghệ phù hợp nhất với nhu cầu của mình, dựa trên các tiêu chí kỹ thuật được xác định và đánh giá rõ ràng. Mục tiêu cuối cùng là một ngày nào đó, khách hàng sử dụng AI “đáng tin cậy”—hay chính xác hơn là công nghệ tạo ra—có thể chắc chắn rằng nó tuân thủ tất cả các tiêu chuẩn ngành.

 

1 https://www.nist.gov/publications/face-recognition-vendor-test-part-3-demographic-effects

Tranh treo tường nghệ thuật hình hươu và thiên nhiên