한 조사에 따르면 대기업에 인공지능을 가르치기 위한 대규모 데이터 세트를 만드는 데 17만 개가 넘는 YouTube 동영상이 사용된 것으로 밝혀졌습니다. 이 데이터 세트는 동영상 이미지를 제외한 48,000개가 넘는 YouTube 채널의 동영상에 있는 텍스트 자막으로 구성되었습니다. 일부 기업에서 YouTube 동영상에서 대본을 포함한 광범위한 데이터를 스크랩하고 있는 것으로 밝혀졌으며, 이는 앞으로도 계속 문제가 될 수 있습니다.
Apple, Anthropic 및 기타 회사에서 AI 학습에 YouTube 동영상 사용
—