시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.04.19 [12:25]

세상을 바꾸자
AI바이오제약 수명연장
자율차,드론, 교통, 에너지,기후
유투브
신기술&메타버스AR/VR
AiMindbot과 미래 우주
챗GPT와 AI, 로봇
라이프,거버넌스, 조직, 유망직종

신기술&메타버스AR/VR

[Meta, Wikipedia 사실 확인을 위한 AI 구축] 총 650만 개 기사. Facebook의 Meta는 위키피디어 정보를 확인 희망한다. 지난달에 게시된 블로그 게시물에서 회사 직원들은 AI가 Wikipedia를 보다 정확하게 만드는 데 어떻게 하나? Meta의 Fundamental AI Research 기술 수석 관리자인 Fabio Petroni는 Digital Trends 와의 인터뷰 에서 "우리가 한 일은 이러한 모든 웹 페이지를 단락으로 나누고 각 단락에 대한 정확한 표현을 제공하여 이러한 모든 웹 페이지의 색인을 구축하는 것입니다." 라고 말했다도움이 되는지 설명한다.

박영숙세계미래보고서저자 | 기사입력 2022/09/20 [21:18]

신기술&메타버스AR/VR

[Meta, Wikipedia 사실 확인을 위한 AI 구축] 총 650만 개 기사. Facebook의 Meta는 위키피디어 정보를 확인 희망한다. 지난달에 게시된 블로그 게시물에서 회사 직원들은 AI가 Wikipedia를 보다 정확하게 만드는 데 어떻게 하나? Meta의 Fundamental AI Research 기술 수석 관리자인 Fabio Petroni는 Digital Trends 와의 인터뷰 에서 "우리가 한 일은 이러한 모든 웹 페이지를 단락으로 나누고 각 단락에 대한 정확한 표현을 제공하여 이러한 모든 웹 페이지의 색인을 구축하는 것입니다." 라고 말했다도움이 되는지 설명한다.

박영숙세계미래보고서저자

| 입력 : 2022/09/20 [21:18]

Meta, Wikipedia 사실 확인을 위한 AI 구축 - 총 650만 개 기사

2022년 8월 26일

30세 이상의 대부분의 사람들은 아마도 좋은 구식 백과사전으로 조사를 했던 기억이 있다. 책장에서 많은 양의 책을 꺼내 관심 주제에 대한 색인을 확인한 다음 해당 페이지로 넘어가 읽기 시작했다. 구글 검색창에 단어 몇 개를 입력하는 것만큼 쉽지는 않았지만 긍정적인 면에서는 브리태니커 나 세계 책 의 페이지에서 찾은 정보 가 정확하고 사실이라는 것을 알았다.

오늘날 인터넷 조사에서는 그렇지 않다. 압도적으로 많은 출처는 충분히 혼란스러웠지만 잘못된 정보의 확산을 추가하면 온라인에서 읽은 단어를 믿는 사람이 있다는 것은 놀라운 일이다.

Wikipedia가 그 예이다. 2020년 초 현재 이 사이트의 영어 버전은 하루 평균 약 2억 5,500만 페이지 뷰를 기록하여 인터넷에서 8번째로 많이 방문한 웹사이트가 되었다. 지난달 기준으로 7위까지 올라갔고 , 영문판은 현재 650만개 이상의 기사를 보유하고 있다.

그러나 이 이동 정보소스만큼 트래픽이 많을 수 있지만 그 정확성은 약간 아쉬운 부분을 남긴다. 사이트 자체의 신뢰성에 대한 페이지 에는 "온라인 백과사전은 자신을 출처로 신뢰할 수 있다고 생각하지 않으며 독자가 학술 또는 연구 환경에서 이를 사용하는 것을 권장하지 않습니다."라고 명시되어 있다.

이전 Facebook의 Meta는 위키피디어 정보를 확인 희망한다. 지난달에 게시된 블로그 게시물에서 회사 직원들은 AI가 Wikipedia를 보다 정확하게 만드는 데 어떻게 도움이 되는지 설명한다.

수만 명이 사이트 편집에 참여하지만 그들이 추가한 사실이 반드시 정확하지는 않다. 인용이 있는 경우에도 항상 정확하거나 관련성이 있는 것은 아니다.

Meta는 이러한 인용을 스캔하고 해당 콘텐츠를 Wikipedia 기사와 상호 참조하여 주제가 정렬되어 있을 뿐만 아니라 인용된 특정 수치가 정확한지 확인하는 기계학습 모델을 개발하고 있다.

이것은 단순히 숫자를 선택하고 일치하는지 확인하는 문제가 아닙니다. Meta의 AI는 인용된 출처의 내용을 "이해"해야 한다(복잡성 이론 연구원 Melanie Mitchell 이 말했듯이 "이해"는 잘못된 이름이지만 AI는 여전히 "협소한" 단계에 있으므로 고도로 정교한 패턴 인식, "이해"는 여전히 매우 다른 인간 인식에 사용되는 단어이다).

Meta의 모델은 텍스트 문자열을 비교하고 동일한 단어를 포함하는지 확인하는 것이 아니라 자연어 이해(NLU) 기술을 사용하여 도달하는 텍스트 블록의 수학적 표현을 비교하여 내용을 "이해"한다.

Meta의 Fundamental AI Research 기술 수석 관리자인 Fabio Petroni는 Digital Trends 와의 인터뷰 에서 "우리가 한 일은 이러한 모든 웹 페이지를 단락으로 나누고 각 단락에 대한 정확한 표현을 제공하여 이러한 모든 웹 페이지의 색인을 구축하는 것입니다." 라고 말했다 . “그것은 구절을 한 단어로 표현하는 것이 아니라 구절의 의미를 나타내는 것입니다. 이는 유사한 의미를 가진 두 개의 텍스트 덩어리가 이 모든 구절이 저장되는 결과 n차원 공간에서 매우 가까운 위치에 표시될 것임을 의미합니다.”

AI는 400만 개의 Wikipedia 인용 세트에 대해 교육을 받고 있으며 사이트에서 잘못된 인용을 찾아내는 것 외에도 제작자는 결국 방대한 데이터 색인에서 가져와 정확한 출처를 제안할 수 있기를 바란다. 지속적으로 업데이트한다.

해결해야 할 한 가지 큰 문제는 출처의 신뢰성에 대한 등급 시스템에서 작업하는 것이다. 예를 들어 과학 저널의 논문은 블로그 게시물보다 높은 등급을 받는다. 온라인 콘텐츠의 양은 매우 방대하고 다양하여 거의 모든 주장을 뒷받침하는 "출처"를 찾을 수 있지만 잘못된 정보에서 잘못된 정보를 구문 분석한다(전자는 잘못된 것을 의미하고 후자는 고의적으로 기만하는 것을 의미함). 동료 검토를 거치지 않은 사람에게서, 급하게 뺨을 맞은 사람에게서 사실 확인을 받는 것은 작은 일이 아니라 신뢰와 관련하여 매우 중요한 일이다.

Meta는 해당 모델을 오픈소스화했으며, 궁금한 분들은 검증 도구 의 데모 를 볼 수 있다. Meta의 블로그 게시물은 회사가 이 프로젝트에서 Wikimedia와 협력하지 않고 있으며 아직 연구 단계에 있으며 현재 Wikipedia의 콘텐츠를 업데이트하는 데 사용되지 않는다고 언급했다.

당신이 Wikipedia에서 읽는 모든 것이 정확하고 신뢰할 수 있는 멀지 않은 미래를 상상한다면, 어떤 종류의 연구도 너무 쉽게 하지 않을까? 다양한 소스를 직접 확인하고 비교하는 것만큼 가치 있는 것이 있지 않나? 무거운 책을 샅샅이 뒤지는 것에서 검색 엔진에 몇 단어를 입력하고 "Enter" 키를 누르는 것은 큰 도약이었다. 우리는 Wikipedia가 연구의 출발점에서 마지막 단어를 얻는 출처로 이동하기를 정말로 원하나?

어쨌든 메타의 AI 연구팀은 온라인 백과사전을 개선할 수 있는 도구를 위해 계속 노력할 것이다. 페트로니는 "결국 우리는 호기심에 이끌렸다고 생각한다" 고 말했다. “우리는 이 기술의 한계가 무엇인지 알고 싶었다. 우리는 [이 AI]가 이러한 맥락에서 의미 있는 일을 할 수 있는지 확신할 수 없었다. 아무도 비슷한 일을 시도한 적이 없다.”

이미지 크레디트: Pixabay 로부터 입수된 Gerd Altmann

박영숙세계미래보고서저자의 다른기사보기

[세계미래보고서]시리즈, 판매제품

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

많이 본 기사

[소멸직종 15] 소멸직종 15가지 2030년 여행사와 직원, 캐시어 점원, 패스트푸드 요리사, 우체부, 은행원, 섬유 노동자, 인쇄소, 보석상, 배달원, 텔레마케터, 어민, 법무비서관, 조립제작사,

[AI반려봇 시대가 온다 (3)] 그러면 이제 AI반려봇으로 돈을 벌어야 하나? 그렇다. 에이아이마인드봇(주) (대표이사 배영훈)라는 회사가 이미 설립되어서 AI반려봇 제작, 생산, 국내외 판매를 준비

유투브[피터디아만디스-로봇택시 등장으로 인한 운전 해방으로 연간 216시간 되돌려 받는다: Tesla 및 WAYMO] 로봇 운전사의 시대가 도래함으로 운전으로부터 해방된 이 시간은 휴식, 생산성, 심지어 여가의 시간으로 바뀔 수 있다.

T[2024년 세계 대학 순위 1위 움직임] QS 세계 대학 순위는 오랫동안 세계에서 가장 영향력 있는 대학 순위 지표 중 하나였다. 이 순위는 학술적 명성, 연구 영향력, 교육 품질 등을 기반으로 대학을 평가했다. 하지만 올해에는 지속 가능성, 고용 결과, 국제 연구 네트워크라는 세 가지 새로운 지표가 추가되었다.

[충격 흡수 소재] 금속처럼 강하지만 폼처럼 가벼운 새로운 충격 흡수 소재. 존스홉킨스대학의 연구원들은 초경량이지만 금속을 보호하는 새로운 충격 흡수 재료를 개발했다. 이 재료는 더 가볍고 강하며 무엇보다도 재사용이 가능한 헬멧, 갑옷 및 차량 부품을 만들 수 있다.

[휴머노이드 로봇, 비즈니스 혁신 촉진] 글로벌 컨설팅 기업 골드만삭스(GoldmanSachs)의 조사에 따르면, 휴머노이드 시장규모는 2035년까지 380억달러로 성장할 전망

[양자 컴퓨팅: 얼어붙은 상태에서 벗어나기] Google, IBM 및 PsiQuantum과 같은 회사는 이러한 거대한 컴퓨팅을 수용하기 위해 냉각 시스템으로 가득 찬 거대한 창고를 구상

유투브 책[2023년에 얼마나 많은 사람들이 YouTube를 사용하나 각종 통계들] 2006년 20억으로 구글이 사들인 유투브는 2005년 2월 14일에 설립, 첫비디오는 4월 23일에 게시, 지금은 20억명이 넘는 사용자보유, 인터넷사용자 43%가 매일 유투브를 본다.

마인드봇[반려로봇의 시대가 온다] 대부분의 가정에서 적어도 한 대 이상의 반려로봇을 보유하게 되는 시대는 2040년대 초반에 접어들 것으로 예상된다.

마인드봇[선택받은 가족의 등장: 사촌의 쇠퇴와 친족관계의 확장을 탐색하다] 사촌의 감소는 두드러진다. 연구 결과, 미래 세대는 과거 세대에 비해 살아있는 사촌의 수가 크게 줄어들 것으로 예상된다. 이는 어린이들이 성장하면서 형성하는 사회적 네트워크와 가족 관계에 상당한 영향을 미칠 수 있다.

신기술&메타버스AR/VR 많이 본 기사

[사우디아라비아, 세계 최초의 3D 프린팅 모스크 공개] 건축 혁신을 향한 획기적인 진전으로, 사우디아라비아 왕국은 제다(Jeddah)의 알자하라(Al-Jawhara) 교외 지역에 자리잡은 세계 최초의 3D프린팅 모스크를 자랑스럽게 공개했다.

[타이탄 공개: CEREBRAS, AI 패권을 위한 세계 최대 컴퓨터 칩 공개] WSE-3의 공개는 컴퓨팅의 새로운 시대를 예고하며 AI 기능의 경계를 전례 없는 수준으로 끌어올리고 기술 혁신의 최전선에서 Cerebras의 위치를 확고히 할 것

[조명 웨어러블: 과학자들이 웨어러블 인터페이스용 다색 광변색 섬유 개발] 통기성, 유연성, 내구성으로 유명한 섬유는 웨어러블 기기를 위한 최적의 기질로 등장하여 기술을 의류에 완벽하게 통합한다

[3D프린터 ICON, 다층 구조물용 로봇 3D 프린터 PHOENIX 공개] 텍사스에 본사를 둔 ICON은 저탄소 혼합물을 사용하여 완전히 밀폐된 다층 건물을 건설하도록 설계된 획기적인 로봇 팔 장착형 3D 프린터인 Phoenix의 데뷔

[초당 156조 3000억 프레임을 촬영하는 세계에서 가장 빠른 카메라] 캐나다 INRS Énergie Matériaux Télécommunications Research Center의 엔지니어들은 초당 156.3 조 프레임(fps)이라는 놀라운 속도로 촬영할 수 있는 세계에서 가장 빠른 카메라를 개발했다.

최신기사

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

S[중국 도시 토지의 45%가 인공 개발로 인해 급속히 가라앉고 있다] 중국의 가장 인구 밀도가 높은 지역들이 해수면 상승과 급격한 토지 침하라는 이중의 위협에 직면해 있다. 과학자들은 현재의 추세가 지속된다면, 2120년까지 침수되는 도시 지역이 세 배로 늘어나 최대 1억 2,800만 명의 인구가 영향을 받을 수 있다고 경고

S[돈 벌려면 미국으로, AI취업 핫스팟] 산호세, 시애틀, 샌프란시스코 등 서해안 3개 도시가 미국 AI 핫스팟 중 가장 높은 순위를 차지했다. 2024년 1분기에는 시애틀에서만 거의 3,000개의 새로운 AI 일자리가 게시되었다. 한편 산호세에서는 신규 일자리의 약 7.5%가 AI와 관련이 있다.

S[AI가 세계 언어에 어떤 영향을 미칠 것인가] 인터넷의 언어 불균형: AI 시대의 소수 언어 위기. 전세계 웹사이트의 90%는 단 10개 언어로 작성된다. 영어 중심 모델은 사람들이 모국어를 버리고 대신 온라인에서 더 일반적인 언어를 사용

마인드봇[인간형로봇] 이 로봇은 당신이 언제 웃을지 예측하고 신호에 맞춰 다시 웃어. 로봇의 경우, 진정한 미소를 찾으려는 시도는 인간과 비슷할 정도로 가깝지만 약간의 불안감을 주는 불쾌한 계곡에 빠지는 경우가 많다

회원약관 ㅣ 개인정보취급방침 ㅣ 회사소개 ㅣ 청소년보호정책 ㅣ 직원게시판 ㅣ 기사제보 ㅣ 보도자료 ㅣ 기사검색

AI넷ㅣ 주소 : 우)02821 서울특별시 성북구 북악산로 1길 31 ㅣ 전화 : 02-313-6300 ㅣ 팩스 : 02-908-9494
등록번호 : 서울, 아02236ㅣ 등록일 : 2009.11. 19. ㅣ E-mail : unfutures@gmail.com, futures2055@gmail.com
회사명 : AI넷 ㅣ 발행/편집인 : 박영숙ㅣ 발행일: 2020.09.05｜청소년보호책임자 : 박영숙
사업자등록번호 : 209-15-39241 (사)유엔미래포럼 www.unfuture.org
Copyright ⓒ 2020 AI넷. All rights reserved. (This is a non-profit organization/a free newspaper.)