시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.04.19 [09:48]

세상을 바꾸자
AI바이오제약 수명연장
자율차,드론, 교통, 에너지,기후
유투브
신기술&메타버스AR/VR
AiMindbot과 미래 우주
챗GPT와 AI, 로봇
라이프,거버넌스, 조직, 유망직종

AIbio소식

[AI 구현에서 데이터 품질의 중요성] 인공지능의 세계는 끊임없이 변화하고 있다. 회사마다 데이터를 다른 방식으로 사용하지만 데이터 품질은 AI 구현 프로젝트에서 여전히 필수적이다. 신뢰할 수 있는 양질의 데이터가 있다면 방대한 데이터 세트의 필요성을 없애고 성공 가능성을 높일 수 있다. 다른 모든 조직과 마찬가지로 조직이 AI 구현으로 전환하는 경우 양질의 데이터가 있는지 확인해야한다. 소스가 신뢰할 수 있는지 확인하고 데이터 요구 사항을 준수하는지 확인하기 위해 실사를 수행해야 한다.

https://www.unite.ai/importance-of-data-quality-in-ai-implementation/

JM Kim | 기사입력 2022/09/10 [00:00]

AIbio소식

[AI 구현에서 데이터 품질의 중요성] 인공지능의 세계는 끊임없이 변화하고 있다. 회사마다 데이터를 다른 방식으로 사용하지만 데이터 품질은 AI 구현 프로젝트에서 여전히 필수적이다. 신뢰할 수 있는 양질의 데이터가 있다면 방대한 데이터 세트의 필요성을 없애고 성공 가능성을 높일 수 있다. 다른 모든 조직과 마찬가지로 조직이 AI 구현으로 전환하는 경우 양질의 데이터가 있는지 확인해야한다. 소스가 신뢰할 수 있는지 확인하고 데이터 요구 사항을 준수하는지 확인하기 위해 실사를 수행해야 한다.

https://www.unite.ai/importance-of-data-quality-in-ai-implementation/

JM Kim

| 입력 : 2022/09/10 [00:00]

인공지능 및 머신러닝 기술은 모든 규모의 산업에 상당한 이점을 제공할 수 있다. McKinsey 보고서에 따르면 인공지능기술을 사용하는 기업은 2030년까지 현금 흐름이 두 배로 증가하게 된다. 반대로 AI를 배포하지 않는 기업은 현금 흐름이 20% 감소하게 된다. 그러나 그러한 혜택은 재정 이상의 것이다. AI는 기업이 노동력 부족 문제를 해결하는 데 도움이 될 수 있다. 또한 AI는 고객 경험과 비즈니스 결과를 크게 개선하여 비즈니스를 더욱 안정적으로 만든다.

AI에는 많은 장점이 있는데 왜 모든 사람이 AI를 채택하지 않을까? 2019년 PwC 설문조사에 따르면 기업의 76%가 비즈니스 가치를 개선하기 위해 AI를 사용할 계획이다. 그러나 겨우 15%만이 비즈니스 목표를 달성하기 위해 고품질 데이터에 액세스할 수 있다. Refinitiv의 또 다른 연구에 따르면 응답자의 66%는 품질이 낮은 데이터가 AI를 효과적으로 배포하고 채택하는 능력을 저해한다고 말했다.

설문 조사에 따르면 머신러닝 및 AI 기술 작업의 세 가지 주요 과제는 다음과 같다. "데이터의 범위, 기록 및 모집단에 대한 정확한 정보", "불완전하거나 손상된 기록 식별" 및 "데이터 정리 및 정규화". 이는 낮은 품질의 데이터가 기업이 고품질 AI 기반 분석을 얻는 데 주요 장애물임을 보여준다.

데이터가 왜 중요한가?

AI 구현에서 데이터 품질이 중요한 이유는 여러 가지가 있다. 다음은 가장 중요한 몇 가지이다.

1. 가비지 인 및 가비지 아웃

출력이 입력에 크게 의존한다는 것을 이해하는 것은 매우 간단하다. 이 경우 데이터 세트가 오류로 가득 차 있거나 왜곡되어 있으면 결과도 잘못된 방향으로 가게 될 것이다. 대부분의 데이터 관련 문제는 반드시 데이터의 양이 아니라 AI 모델에 제공하는 데이터의 품질에 관한 것이다. 데이터 품질이 낮으면 AI 모델이 아무리 좋아도 제대로 작동하지 않는다.

2. 모든 AI 시스템이 평등하지는 않다

데이터 세트를 생각할 때 일반적으로 양적 데이터 측면에서 생각한다. 그러나 비디오, 개인 인터뷰, 의견, 사진 등의 형태의 질적 데이터도 있다. AI 시스템에서 양적 데이터 세트는 구조화되고 정성적 데이터 세트는 비 구조적이다. 모든 AI 모델이 두 종류의 데이터 세트를 모두 처리할 수 있는 것은 아니다. 따라서 적절한 모델에 대한 올바른 데이터 유형을 선택하는 것은 예상되는 출력을 얻는 데 필수적이다.

3. 품질 대 수량

AI 시스템은 학습을 위해 많은 데이터를 수집해야 한다고 믿어진다. 품질 대 수량에 대한 논쟁에서 기업은 일반적으로 후자를 선호한다. 그러나 데이터 세트가 고품질이지만 본질적으로 더 짧다면 출력이 적절하고 강력하다는 것을 어느 정도 보장할 수 있다.

4. 좋은 데이터셋의 특징

좋은 데이터 세트의 특성은 주관적일 수 있으며 주로 AI가 제공하는 애플리케이션에 따라 다르다. 그러나 데이터 세트를 분석하는 동안 찾아야 하는 몇 가지 일반적인 기능이 있다.

-완전성: 데이터 세트는 데이터 세트에 빈 그리드나 점이 없어야 한다. 모든 셀에는 데이터 조각이 있어야 한다.

-포괄성: 데이터 세트는 가능한 한 포괄적이어야 한다. 예를 들어 사이버 위협 벡터를 찾고 있다면 모든 서명 프로필과 필요한 모든 정보가 있어야 한다.

-일관성: 데이터세트는 할당된 명확한 변수 아래에 맞아야 한다. 예를 들어 패키지 상자를 모델링하는 경우 선택한 변수(플라스틱, 종이, 판지 등)에 해당 범주에 속하려면 적절한 가격 데이터가 있어야 한다.

-정확성: 정확성은 좋은 데이터 세트의 핵심이다. AI 모델에 제공하는 모든 정보는 신뢰할 수 있고 완전히 정확해야 한다. 데이터 세트의 많은 부분이 올바르지 않으면 출력도 정확하지 않다.

-독창성: 이 점은 일관성과 유사하다. 각 데이터 포인트는 제공하는 변수에 대해 고유해야 한다. 예를 들어, 플라스틱 포장지의 가격이 다른 포장 범주에 속하기를 원하지 않는다.

데이터 품질 보장

데이터 원본을 신뢰할 수 있는지 확인하는 것과 같이 데이터 품질을 높이는 방법에는 여러 가지가 있다. 다음은 AI 모델에 대해 최상의 품질 데이터를 얻을 수 있는 몇 가지 최고의 기술이다.

1. 데이터 프로파일링

데이터를 사용하기 전에 데이터를 이해하려면 데이터 프로파일링이 필수적이다. 데이터 프로파일링은 값 분포, 최대값, 최소값, 평균값 및 이상 값에 대한 통찰력을 제공한다. 또한 데이터의 불일치 형식을 지정하는 데 도움이 된다. 데이터 프로파일링은 데이터 세트를 사용할 수 있는지 여부를 이해하는 데 도움이 된다.

2. 데이터 품질 평가

사전 구축된 데이터 품질 규칙의 중앙 라이브러리를 사용하여 중앙 라이브러리로 모든 데이터 세트의 유효성을 검사할 수 있다. 데이터 도구가 내장된 데이터 카탈로그가 있는 경우 해당 규칙을 재사용하여 고객 이름, 이메일 및 제품 코드를 검증할 수 있다. 또한 일부 데이터를 보강하고 표준화할 수도 있다.

3. 데이터 품질 모니터링 및 평가

과학자들은 사용하려는 대부분의 데이터 세트에 대해 사전 계산된 데이터 품질을 가지고 있다. 속성의 범위를 좁혀 속성에 어떤 특정 문제가 있는지 확인한 다음 해당 속성을 사용할지 여부를 결정할 수 있다.

4. 데이터 준비

연구원과 과학자는 일반적으로 AI 모델링을 위해 데이터를 약간 조정해야 한다. 이러한 연구원은 속성을 구문 분석하고 열을 전치하고 데이터에서 값을 계산하기 위해 사용하기 쉬운 도구가 필요하다.

JM Kim의 다른기사보기

인공지능, 머신러닝, 데이터 관련기사목록

[세계미래보고서]시리즈, 판매제품

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

많이 본 기사

[소멸직종 15] 소멸직종 15가지 2030년 여행사와 직원, 캐시어 점원, 패스트푸드 요리사, 우체부, 은행원, 섬유 노동자, 인쇄소, 보석상, 배달원, 텔레마케터, 어민, 법무비서관, 조립제작사,

[AI반려봇 시대가 온다 (3)] 그러면 이제 AI반려봇으로 돈을 벌어야 하나? 그렇다. 에이아이마인드봇(주) (대표이사 배영훈)라는 회사가 이미 설립되어서 AI반려봇 제작, 생산, 국내외 판매를 준비

유투브[피터디아만디스-로봇택시 등장으로 인한 운전 해방으로 연간 216시간 되돌려 받는다: Tesla 및 WAYMO] 로봇 운전사의 시대가 도래함으로 운전으로부터 해방된 이 시간은 휴식, 생산성, 심지어 여가의 시간으로 바뀔 수 있다.

T[2024년 세계 대학 순위 1위 움직임] QS 세계 대학 순위는 오랫동안 세계에서 가장 영향력 있는 대학 순위 지표 중 하나였다. 이 순위는 학술적 명성, 연구 영향력, 교육 품질 등을 기반으로 대학을 평가했다. 하지만 올해에는 지속 가능성, 고용 결과, 국제 연구 네트워크라는 세 가지 새로운 지표가 추가되었다.

[충격 흡수 소재] 금속처럼 강하지만 폼처럼 가벼운 새로운 충격 흡수 소재. 존스홉킨스대학의 연구원들은 초경량이지만 금속을 보호하는 새로운 충격 흡수 재료를 개발했다. 이 재료는 더 가볍고 강하며 무엇보다도 재사용이 가능한 헬멧, 갑옷 및 차량 부품을 만들 수 있다.

[양자 컴퓨팅: 얼어붙은 상태에서 벗어나기] Google, IBM 및 PsiQuantum과 같은 회사는 이러한 거대한 컴퓨팅을 수용하기 위해 냉각 시스템으로 가득 찬 거대한 창고를 구상

[휴머노이드 로봇, 비즈니스 혁신 촉진] 글로벌 컨설팅 기업 골드만삭스(GoldmanSachs)의 조사에 따르면, 휴머노이드 시장규모는 2035년까지 380억달러로 성장할 전망

유투브 책[2023년에 얼마나 많은 사람들이 YouTube를 사용하나 각종 통계들] 2006년 20억으로 구글이 사들인 유투브는 2005년 2월 14일에 설립, 첫비디오는 4월 23일에 게시, 지금은 20억명이 넘는 사용자보유, 인터넷사용자 43%가 매일 유투브를 본다.

마인드봇[반려로봇의 시대가 온다] 대부분의 가정에서 적어도 한 대 이상의 반려로봇을 보유하게 되는 시대는 2040년대 초반에 접어들 것으로 예상된다.

마인드봇[선택받은 가족의 등장: 사촌의 쇠퇴와 친족관계의 확장을 탐색하다] 사촌의 감소는 두드러진다. 연구 결과, 미래 세대는 과거 세대에 비해 살아있는 사촌의 수가 크게 줄어들 것으로 예상된다. 이는 어린이들이 성장하면서 형성하는 사회적 네트워크와 가족 관계에 상당한 영향을 미칠 수 있다.

AIbio소식 많이 본 기사

[MindPlex-이제 글로벌 규모의 양자 통신 보안이 더욱 가까워졌다.] 워털루 대학교 양자 컴퓨팅 연구소(IQC)의 연구원들은 양자점 소스에서 거의 완벽하게 얽힌 광자 쌍을 효율적으로 생성했다.

[영국과 미국은 AI 안전성 테스트에 관한 획기적인 계약을 체결했다.] 각국은 AI의 잠재적 위험을 해결하는 도구와 지침을 개발하기 위해 협력하게 된다.

[AI가 통관 지연을 극복하게 도와준다]국제 운송 물류 조직은 복잡한 서류 업무 프로세스의 압박을 감수하고 있다. 인공지능은 이러한 과도한 수동 데이터 입력을 감소시키고 문서의 정확성과 규정 준수를 보장하며 세금 및 수수료의 정확한 납부를 신속하게 처리한다.

[메탄 오염 문제를 해결하기 위한 AI의 역할] 옥스퍼드 대학의 연구진은 환경 보전을 위한 중요한 돌파구로 트릴리움 테크놀로지스(Trillium Technologies)와 협력하여 우주에서 메탄의 '슈퍼 방출원'을 식별할 수 있는 AI 기반 도구를 개발

[TacticAI: AI를 활용하여 축구 코칭 및 전략 향상] 체스와 바둑에서 성공을 거두며 전략 게임 분야의 전문성으로 유명한 DeepMind가 리버풀 FC와 파트너십을 맺고 TacticAI를 선보였다. 이 AI 시스템은 축구 코치와 전략가가 게임 전략을 개선하고 특히 축구 게임플레이의 중요한 측면인 코너킥 최적화에 중점을 두도록 지원하도록 설계되었다.

최신기사

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

마인드봇[인간형로봇] 이 로봇은 당신이 언제 웃을지 예측하고 신호에 맞춰 다시 웃어. 로봇의 경우, 진정한 미소를 찾으려는 시도는 인간과 비슷할 정도로 가깝지만 약간의 불안감을 주는 불쾌한 계곡에 빠지는 경우가 많다

[4월 18일 AI뉴스] AI 여자친구의 부상, 비디오의 생성적 채우기, Google의 로봇 공학 혁신. 스탠포드 대학의 502페이지 AI 보고서

[LLM 다목적 기초모델 미국선두] ChatGPT 및 기타 AI 플랫폼을 지원하는 일종의 다목적 LLM인 기초 모델의 경우 미국은 중국, 유럽 연합 및 영국보다 훨씬 앞서 있다. 2023년까지 미국에는 100개 이상의 기초 모델이 있었는데, 중국과 EU의 경우 약 20개였다.

회원약관 ㅣ 개인정보취급방침 ㅣ 회사소개 ㅣ 청소년보호정책 ㅣ 직원게시판 ㅣ 기사제보 ㅣ 보도자료 ㅣ 기사검색

AI넷ㅣ 주소 : 우)02821 서울특별시 성북구 북악산로 1길 31 ㅣ 전화 : 02-313-6300 ㅣ 팩스 : 02-908-9494
등록번호 : 서울, 아02236ㅣ 등록일 : 2009.11. 19. ㅣ E-mail : unfutures@gmail.com, futures2055@gmail.com
회사명 : AI넷 ㅣ 발행/편집인 : 박영숙ㅣ 발행일: 2020.09.05｜청소년보호책임자 : 박영숙
사업자등록번호 : 209-15-39241 (사)유엔미래포럼 www.unfuture.org
Copyright ⓒ 2020 AI넷. All rights reserved. (This is a non-profit organization/a free newspaper.)