위 정보는 이번 주 로이터와의 인터뷰에서 메타(Meta)의 글로벌 사업 담당 사장인 닉 클레그(Nick Clegg)가 확인했습니다. 따라서 메타가 9월 27일에 출시한 "다중 인격" AI 훈련 데이터는 사용자가 페이스북과 인스타그램에 공개적으로 게시하는 게시물(글, 이미지)에서 추출됩니다. 비공개 콘텐츠나 친구, 가족, 채팅방에 제한된 공개 범위는 사용되지 않습니다.
클레그는 메타가 AI가 어떤 데이터를 마이닝하는지 통제하기 위해 필요한 기술적 조치를 취하고 있다고 밝혔지만, 이 모델의 작동 방식에 대한 자세한 내용은 밝히지 않았습니다. 메타의 책임자는 "개인정보가 많이 포함된 데이터세트는 제외하며, 개인정보 보호 문제로 인해 링크드인과 같은 사이트의 데이터를 AI 훈련에 사용하지 않습니다."라고 강조했습니다.
Facebook, Instagram의 공개 게시물은 Meta의 AI를 훈련하는 데 사용됩니다.
메타 CEO 마크 저커버그는 메타 AI 비서가 라마 2(Llama 2)라는 대규모 언어 모델과 에뮤(Emu) 텍스트-이미지 변환 모델을 결합하여 "사람처럼 대화할 수 있다"고 설명합니다. 메타의 비서는 텍스트, 오디오, 이미지를 생성할 수 있으며, 최신 ChatGPT를 사용하는 마이크로소프트 빙(Bing) 검색 엔진과의 파트너십을 통해 실시간 정보에 접근할 수 있습니다.
메타 AI는 유명인에 대한 고정관념을 기반으로 한 28개의 챗봇(자동 응답 프로그램)으로 구성되어 있습니다. 테스트 첫날부터 이 도구는 독성을 띠고 그 성격 때문에 과민 반응을 보이는 등 많은 논란에 직면했습니다. 그중 일부 챗봇은 인종차별적인 정보를 제공하고 사용자의 사생활을 지나치게 파고들었습니다. 메타 직원들조차 자사 인공지능이 제공하는 비정상적인 콘텐츠에 대한 우려를 이유로 이 AI를 테스트하지 않겠다고 발표하면서 문제는 더욱 심각해졌습니다.
메타가 소셜 네트워크에 게시된 사용자 데이터를 인공지능에 "공급"하는 방식 또한 저작권 문제에 대한 우려를 불러일으킵니다. 메타가 저작권이 있는 콘텐츠의 복제를 방지하기 위한 조치를 준수하는지 묻는 질문에 회사 관계자는 사용자가 이 플랫폼에서 개인정보 보호 및 지적 재산권을 침해하는 콘텐츠를 제작하는 것을 금지하는 조항만 언급했습니다.
[광고_2]
소스 링크
댓글 (0)