아티클 관련 제품: TwinDoc2.0
들어가며
- TwinDoc의 정의와 개요에 대해 알아보겠습니다.
TwinDoc이란, AI Transformer 기반의 자연어 처리 platform 입니다.
- Transformer Model이란?
Transformer model은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적하여 맥락과 의미를 학습하는 신경망 입니다.
한 문장이 Transformer로 입력되면, 여러 인코더 블록과 디코더 블럭을 통과하여 특정 문장으로 출력됩니다.
인코더 블록과 디코더 블록의 구조는 각 입력된 문장 내 단어 간의 관계를 보여주는 self-attention layer와
모든 단어들에 동일하게 적용되는 fully connected feed-foward layer로 구성되어 있습니다.
추가로 디코더 블록에는 encoder-decoder attention layer가 두 layer 사이에 들어가 있습니다.
- 자연어 처리란?
자연어 처리는 Natural Language Proccessiong으로, NLP 라고도 합니다.
여기서 자연어란, 사람이 평소에 말하는 음성이나 텍스트를 뜻합니다.
그렇다면 자연어 처리란, 음성이나 텍스트를 컴퓨터가 인식하고 처리하는 것을 뜻합니다.
- 쉽게 말하자면, AI에게 한국어를 학습 시켜 단어 하나 하나가 아닌 문단과 문장의 흐름을 이해할 수 있습니다.
- 그렇게 되면 글의 의미를 파악하는 요약과 분류를 수행할 수 있습니다.
- 따라서 TwinDoc을 통해 데이터 분석가 및 현장 업무 담당자를 위한 신속한 문서 처리와 운영 환경을 제공 받을 수 있습니다.
- TwinDoc library는 model개발이 목표입니다.
따라서, 자연어 처리 인공지능(AI) model이 개발되었습니다.
- 한국어 데이터를 TwinDoc library로 model 개발하고, 그 결과로 text 분석을 도출하게 됩니다.
TwinDoc에서는 분류와 요약, 개체명 인식이 가능하게 됩니다.
- 현재 TwinDoc에서는 model 학습 및 개발이 가능하고, 나아가 model 배포와 관리를 할 수 있습니다.
Model 학습이란?
Input 값으로 정답이 있는 Dataset와 Pre-Trained model, Parameter를 주게 되면
Output 값으로 fine-tuned model을 확인할 수 있습니다.
마무리
- AgileSoDA의 TwinDoc이 무엇 인지에 대해 알아보았습니다.
아티클이 유용했나요?
훌륭합니다!
피드백을 제공해 주셔서 감사합니다.
도움이 되지 못해 죄송합니다!
피드백을 제공해 주셔서 감사합니다.
피드백 전송
소중한 의견을 수렴하여 아티클을 개선하도록 노력하겠습니다.