Cách ngăn Facebook lấy dữ liệu để huấn luyện AI

Người dùng Internet có thể xóa thông tin cá nhân đang bị Meta thu thập cho việc đào tạo mô hình AI tạo sinh.

Các mô hình AI hiện nay cần nguồn dữ liệu đầu vào khổng lồ về “học”. Những dữ liệu này được thu thập từ nhiều nguồn trên mạng như hình ảnh, bài viết, bình luận… và trong đó có cả thông tin cá nhân của người dùng mạng xã hội.

Meta cung cấp cho người dùng tùy chọn thay đổi hoặc xóa bất kỳ dữ liệu cá nhân nào của họ mà công ty sử dụng để đào tạo ngôn ngữ lớn và mô hình AI liên quan. Theo cập nhật mới nhất, người dùng có thể vào trang trợ giúp, truy cập mục Quyền của chủ thể dữ liệu đối với AI tạo sinh.

Tại đây có ba lựa chọn gồm: “Tôi muốn truy cập, tải xuống hoặc sửa thông tin cá nhân bất kỳ mà các bên thứ ba cung cấp dùng cho AI tạo sinh”; “Tôi muốn xóa mọi thông tin cá nhân mà các bên thứ ba cung cấp để dùng cho AI tạo sinh” và “Ý kiến khác”.

Logo Meta hiển thị trên smartphone, phía sau là ánh sáng đèn LED của một bo mạch chủ. Ảnh: Reuters

Với tùy chọn đầu tiên, người dùng có thể tải về dữ liệu đã bị “bên thứ ba” thu thập và xem xét trước khi đồng ý cho Meta dùng chúng để đào tạo AI. Trong khi đó, tùy chọn thứ hai yêu cầu nền tảng xóa những gì đang lưu trữ. Nếu có yêu cầu khác, người dùng cần cung cấp họ tên, quốc gia cư trú và email cùng ý kiến của mình, sau đó gửi đi.

Sau khi chọn một trong ba tùy chọn, họ cũng cần vượt qua bài kiểm tra kiểm tra bảo mật. Tuy nhiên, theo CNBC, một số người phản ánh không thể hoàn thành biểu mẫu vì “có vẻ như lỗi phần mềm”.

Dữ liệu nào đang được Meta thu thập?

Meta định nghĩa thông tin của bên thứ ba là dữ liệu “được cung cấp công khai trên Internet hoặc các nguồn được cấp phép”. Hãng cho biết loại thông tin này “có thể đại diện cho một số trong số hàng tỷ mẫu dữ liệu” được sử dụng để đào tạo AI bằng cách dùng những gì thu thập được cho tổng hợp, dự đoán và tạo ra nội dung mới.

Trong bài đăng blog ngày 30/8, Meta cho biết họ lấy thông tin công khai này, bên cạnh việc dùng dữ liệu được cấp phép từ các đối tác. “Để dạy mô hình theo cách hiệu quả, chúng tôi cần một lượng dữ liệu lớn. Do đó, chúng tôi dùng kết hợp các nguồn khác nhau trong quá trình đào tạo. Những nguồn này gồm thông tin công khai trên mạng, thông tin được cấp phép, cũng như thông tin từ các sản phẩm và dịch vụ của Meta”, bài viết nêu.

Trong quá trình thu thập, Meta có thể lấy được cả thông tin cá nhân. Chẳng hạn một bài viết công khai có thể chứa thông tin tác giả. Công ty nói trong quá trình lấy dữ liệu, quyền riêng tư của người dùng được đảm bảo và có đội ngũ chuyên trách để làm điều này.

Meta hiện vận hành mô hình ngôn ngữ lớn LLaMA, được công bố đầu năm nay. Nó hoạt động dưới dạng mở, cho phép nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí. Phát ngôn viên Meta cho biết phiên bản LLaMA thế hệ mới, LLaMA 2, chưa sử dụng dữ liệu của người dùng trên các nền tảng như Facebook, Instagram của Meta để huấn luyện AI.

“Tùy vào nơi sinh sống, mọi người có thể thực hiện quyền làm chủ dữ liệu, có thể phản đối chúng tôi khai thác một số dữ liệu nhất định để đào tạo AI”, phát ngôn viên Meta nói. “Họ có quyền biết thông tin của họ đang được chúng tôi sử dụng thế nào”.

Đến nay, hầu hết công ty công nghệ như Meta, Microsoft, Google hay OpenAI vẫn thu thập dữ liệu công khai trên Internet để phục vụ quá trình huấn luyện AI. Tuy nhiên, giới chuyên môn nhiều lần đặt câu hỏi về việc lượng lớn thông tin thu được đang sử dụng thế nào.

Tuần trước, liên minh gồm các cơ quan bảo vệ dữ liệu từ Anh, Canada, Thụy Sĩ và một số quốc gia khác đưa ra tuyên bố chung rằng các công ty công nghệ lớn như Meta, Alphabet, ByteDance, X, Microsoft cần phải tuân theo luật bảo vệ dữ liệu và quyền riêng tư tùy theo những nơi đang hoạt động. Nhóm khuyến cáo người dùng cần có ý thức cao hơn trong việc kiểm soát và bảo vệ thông tin đưa lên Internet.

Bảo Lâm

Các bài viết liên quan

Dữ liệu 'bẩn' sau các công cụ huấn luyện siêu AI Google, Meta sử dụng bộ dữ liệu "đã làm sạch" để đào tạo AI, nhưng thực tế vẫn còn chứa nội dung độc hại và nguy hiểm. Nửa năm qua, các chatbot như ChatGPT trở nên…
Meta dùng AI để ngăn chặn nạn tống tiền người dùng Ngày 11/4, Tập đoàn công nghệ Meta của Mỹ cho biết đang phát triển các công cụ mới để bảo vệ người dùng ở độ tuổi thanh thiếu niên trước các trò lừa đảo "tống tiền"…
Meta đối mặt với khiếu nại liên quan tới thu… Ngày 28/2, 8 nhóm bảo vệ quyền lợi người tiêu dùng các quốc gia thuộc Liên minh châu Âu (EU) đã đệ đơn khiếu nại tập đoàn công nghệ Meta Platforms, yêu cầu các cơ quan…
iOS 17 sẽ đổi giao diện màn hình khoá và Apple… Mới đây, một nguồn tin được rò rỉ trên Weibo đã tiết lộ thêm những thông tin mới về phiên bản iOS 17 sắp tới. Trước đó, đây cũng là nguồn tin đã tiết lộ chính…
Nghề 'huấn luyện' AI Alexej Savreux, 34 tuổi, sinh sống tại thành phố Kansas (Mỹ), từng làm đủ các nghề trong nhiều năm trước khi trở thành một huấn luyện viên AI tại công tyOpenAI sở hữu chatbot ChatGPT vốn…
Elon Musk huấn luyện AI bằng các tweet Elon Musk sử dụng những nội dung người dùng đăng trên Twitter để huấn luyện xAI, gây lo ngại về quyền riêng tư. Trong chương trình Twitter Spaces cuối tuần qua, Musk chia sẻ về AI…
NASA huấn luyện chó robot cho sứ mệnh giải cứu trên… Trong khuôn khổ của dự án LASSIE do NASA tài trợ, một nhóm nghiên cứu đa ngành đã tiến hành thử nghiệm chú chó robot có tên Spirit với nhiệm vụ định hướng trên các…
Cầu thủ Liverpool được huấn luyện bằng AI thế nào Mô hình TacticAI sử dụng 7.176 quả phạt góc của Liverpool để huấn luyện cầu thủ và tư vấn chiến thuật theo thời gian thực ngay trong trận đấu. Trợ lý chiến thuật TacticAI là thành…

Từ khóa

Nguyễn Hoàng Tâm04/09/2023Cập nhật mới nhất: 04/09/2023

0 2 Đã đọc 3 phút trước

Cho xem nhiều hơn

Cách ngăn Facebook lấy dữ liệu để huấn luyện AI

Các bài viết liên quan

Nguyễn Hoàng Tâm

Đọc tiếp

Hệ điều hành iPadOS của Apple đối mặt với các quy định nghiêm ngặt hơn của EU

Đại thắng mùa Xuân 1975: “Đánh địch bằng mưu kế, thế trận và thắng địch bằng thế thời”

OpenAI bị kiện tại châu Âu

Baidu và Tesla đạt thỏa thuận về dịch vụ bản đồ chỉ đường tại Trung Quốc

10 tính năng AI được dự đoán sẽ có mặt trên iOS 18

Dưới 12 triệu, mẫu iPhone này rất đáng mua

Nghe nhạc chất lượng cao với Apple Music

Samsung Galaxy Watch 7 được đồn đại có tính năng theo dõi lượng đường trong máu

iPad Pro có thể “nhảy cóc” sang sử dụng chip M4, bỏ qua thế hệ M3

Đây là mô hình iPhone 16 series: Bản Pro Max có màn hình lớn nhất lịch sử

Hệ điều hành iPadOS của Apple đối mặt với các quy định nghiêm ngặt hơn của EU

Đại thắng mùa Xuân 1975: “Đánh địch bằng mưu kế, thế trận và thắng địch bằng thế thời”

OpenAI bị kiện tại châu Âu

Baidu và Tesla đạt thỏa thuận về dịch vụ bản đồ chỉ đường tại Trung Quốc

10 tính năng AI được dự đoán sẽ có mặt trên iOS 18

Dưới 12 triệu, mẫu iPhone này rất đáng mua

Nghe nhạc chất lượng cao với Apple Music

Samsung Galaxy Watch 7 được đồn đại có tính năng theo dõi lượng đường trong máu

iPad Pro có thể “nhảy cóc” sang sử dụng chip M4, bỏ qua thế hệ M3

Đây là mô hình iPhone 16 series: Bản Pro Max có màn hình lớn nhất lịch sử

One UI 6.1 sắp khắc phục sự cố về bàn phím

Hoàn thiện chính sách quản lý tài sản ảo là một “bài toán khó”

Nhiều doanh nghiệp tham gia triển lãm sản phẩm khoa học, công nghệ và đổi mới sáng tạo

Robot hình người của Tesla sẵn sàng ra thị trường vào cuối năm sau

Game Zenless Zone Zero của miHoYo hé lộ thời điểm phát hành

PicsArt là gì? Những tính năng hay trên PicsArt mà các bạn có thể sử dụng để tạo ra những bức ảnh tuyệt vời

Cách trình chụp màn hình từ video YouTube với chất lượng cao nhất

Dùng Dual Recording chỉ có trên Galaxy S24: Quay được 2 video bằng 2 camera cùng lúc quá tiện!

Hướng dẫn cách xin quyền unlock Redmi Turbo 3 miễn phí, siêu nhanh

Doanh thu hàng năm của Smilegate là bao nhiêu?

Các bài viết liên quan

Đọc tiếp

Hệ điều hành iPadOS của Apple đối mặt với các quy định nghiêm ngặt hơn của EU

Đại thắng mùa Xuân 1975: “Đánh địch bằng mưu kế, thế trận và thắng địch bằng thế thời”

OpenAI bị kiện tại châu Âu

Baidu và Tesla đạt thỏa thuận về dịch vụ bản đồ chỉ đường tại Trung Quốc

10 tính năng AI được dự đoán sẽ có mặt trên iOS 18

Dưới 12 triệu, mẫu iPhone này rất đáng mua

Nghe nhạc chất lượng cao với Apple Music

Samsung Galaxy Watch 7 được đồn đại có tính năng theo dõi lượng đường trong máu

iPad Pro có thể “nhảy cóc” sang sử dụng chip M4, bỏ qua thế hệ M3

Đây là mô hình iPhone 16 series: Bản Pro Max có màn hình lớn nhất lịch sử

Cách tra cứu phạt nguội ô tô đơn giản, hiệu quả nhất 2023

Cách đăng nhập FB trên máy tính, điện thoại đơn giản nhất

Những bài viết liên quan

Adblock Detected