Data Management

“AI 비즈니스의 핵심, 최적의 AI Data Management”

Process

AI 모델의 품질을 최우선으로 생각하여,
체계적인 프로세스를 통해 데이터를 구축하고 관리합니다.

01. 데이터 수집​

AI학습에 필요한 이미지, 텍스트, 오디오 데이터를 수집합니다.

02. 데이터 정제 가공​

반자동화 된 스마트 시스템을 통하여 빠르고 정확하게 정형·비정형 데이터를 가공합니다.

03. 크라우드 워커

크라우드 소싱으로 스마트폰과 PC를 통해 언제 어디서나 효율적인 작업 환경으로 실시간 데이터를 수집, 생성 합니다.

04. 데이터 검수

각 데이터에 특화된 숙련된 전문 검수자를 통해 데이터를 검수 및 수정합니다. 다중 검수 시스템을 통하여 데이터 품질을 보장합니다.

05. AI 모델링​

모델 개발의 목적성에 따라 수집된 데이터를 가지고 AI를 학습합니다.

06. 공정 관리 시스템

작업 결과 상황을 관리자가 확인하며 데이터 퀄리티를 높일 수 있습니다. 데이터 구축의 진행 상황을 대시 보드로 확인하며 관리 할 수 있습니다.

Collection

비즈니스 요구 사항에 따라 이미지, 오디오 등의 비정형 데이터를 수집합니다.
각 데이터의 특성에 특화된 시스템을 통해 고품질의 데이터를 빠르게 수집할 수 있습니다.

음성 데이터 수집

고객이 요구하는 음성 데이터 특성을 반영하기 위해 화자, 언어와 같은 유형을 고려하여 음성 데이터를 수집할 수 있는 최적화된 서비스를 제공합니다.
요구조건에 최적화된 자동화를 통해 고품질의 음성 데이터 셋을 구축합니다.

자유 발화 데이터 수집

사용자간 실시간 대화를 통해 자유 발화 데이터를 수집하며, 각각의 음성 특성에 대한 다양성을 확보해 자유 발화 데이터를 수집할 수 있는 서비스를 제공합니다.

구간별 전사 텍스트를 자동으로 추출하고 감정을 태깅할 수 있는 기능을 제공하여,
폭넓은 분야에 활용이 가능한 음성 데이터를 구축합니다.

채팅 데이터 수집

페르소나의 다양한 특성이 반영된 멀티 세션 채팅 데이터 수집에 최적화된 서비스를 제공합니다.

전문 지식을 검색할 수 있는 기능을 제공하여 사용자가 대화에 전문 지식을 활용할 수 있어 정확한 채팅 데이터 구축이 가능합니다.

전문 지식 데이터 수집

특정 분야의 저작 재산권을 확보한 전문 지식을 기반으로 데이터 베이스를 제작하여 신뢰도 높은 데이터 구축이 가능합니다.

전문 지식에 최적화된 수집 화면을 통해 사용자의 작업 편의성을 향상시킵니다.

Inspection​​

전문 검수 인력과 다중 검수 시스템 운영을 통해 품질이 떨어지는
데이터를 사전에 식별하여 데이터의 신뢰성을 높입니다.

음성 데이터 검수

많은 양의 데이터를 한 눈에 보며 음성 데이터를 편집할 수 있도록 설계되어 대용량 음성 데이터 가공에 최적화되어 있습니다.

음성 구간별 설정 및 재생, 무음 구간 탐지 등 생산성 기능을 제공하고 다양한 단축키를 제공하여 사용자의 작업 편의성을 향상시킵니다.

채팅 데이터 검수

세션 별로 대화 내용과 페르소나 정보들을 한눈에 확인할 수 있는 검수 편의성을 제공합니다.

이를 통해 사용자는 많은 양의 데이터를 효과적으로 검수할 수 있어 빠른 시간 내에 고품질의 채팅 데이터를 구축합니다.

전문 지식 데이터 검수

전문 지식 검수에 최적화된 시스템으로 대화 내용 검수를 통해 문장의 제외 처리가 가능합니다.

자동화된 기능을 통해 카테고리 정보와 어절 수 등의 검수를 더욱 효율적으로 진행할 수 있습니다.

Quality​​

데이터 품질 관리 도구를 활용해 데이터의 일관성과 정확성을
확보하여 비즈니스에 활용 가능하도록 품질을 보장합니다.

공정 관리 솔루션

공정 관리 솔루션을 통해 수집된 데이터에 대한 데이터 모니터링이 가능하고 데이터 유형, 작업자 유형 별로 공정 관리에 필요한 수치를 시각화한 그래프로 확인하고 통계치를 파일로 출력할 수 있습니다.

고품질의 학습 데이터를 구축하기 위해 텍스트, 오디오 등 데이터를 가공하는 2차 검수 시스템과 가공된 데이터를 선별하는 3차 검수 시스템이 통합되어 있습니다.

데이터 정제 가공 서비스

STT 엔진을 통해 전사된 데이터를 정제 가공할 수 있는 솔루션은 발화자, 발화 주제, 대화 정보와 같은 다양한 데이터에 대하여 정제 가공을 할 수 있습니다.

여러 환경에서 수집된 데이터를 서비스를 통해 정제 및 가공 함으로써 고품질의 데이터를 구축할 수 있습니다.

구문 정확성 검증 도구

구문 정확성 검증도구는 파일들이 정의된 *스키마 형식에 어긋나지 않는지 검사하고 오류가 난 파일들과 해당 오류 내역을 확인할 수 있는 도구입니다.

이를 통해 데이터 품질을 더욱 확보하고 AI 모델 성능 향상에 기여할 수 있습니다.

*스키마: 데이터베이스에서 데이터 구조와 그 표현법, 자료 간의 관계를 형식 언어로 정의한 것

With US

우리는 다양한 분야의 경험을 통해 성과를 쌓아왔습니다.
이를 바탕으로 정확한 고품질의 데이터를 구축해 고객의 니즈를 충족시킵니다.

누적 작업 파일​

50,000K+

음성 데이터 가공 시간

100K+

데이터 정확도

99.8%

고객 맞춤 솔루션

100%

Reference

2023

NIA AI 학습데이터 구축

07. 분야별 한국어 멀티세션 데이터 (일반, 기술, 문화)
96. 헬스케어 챗봇 말뭉치 데이터

2023
2022

NIA AI 학습데이터 구축

13. 감정이 태깅된 자유 대화 (성인, 청소년)
14. 명령어 인식을 위한 소음 환경 데이터
20. 한국어 멀티세션 대화

2022
2021

NIA AI 학습데이터 구축

02. 화자 인식용 음성 데이터
07. 아동 음성 데이터

2021

Would you like to start with us?​

지금 바로 AI 서비스 구축을 위한 맞춤형 서비스를 경험해 보세요.