TwinDoc이 무엇인가요?

작성자 김아름 수정일 2022-10-28 08:53

#TwinDoc2.0, #트윈독2.0

아티클 관련 제품: TwinDoc2.0

들어가며

  • TwinDoc의 정의와 개요에 대해 알아보겠습니다.



TwinDoc이란, AI Transformer 기반자연어 처리 platform 입니다.


  • Transformer Model이란?

Transformer model은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적하여 맥락과 의미를 학습하는 신경망 입니다.


한 문장이 Transformer로 입력되면, 여러 인코더 블록과 디코더 블럭을 통과하여 특정 문장으로 출력됩니다.

인코더 블록과 디코더 블록의 구조는 각 입력된 문장 내 단어 간의 관계를 보여주는 self-attention layer와

모든 단어들에 동일하게 적용되는 fully connected feed-foward layer로 구성되어 있습니다.

추가로 디코더 블록에는 encoder-decoder attention layer가 두 layer 사이에 들어가 있습니다.

 


  • 자연어 처리란?

자연어 처리는 Natural Language Proccessiong으로, NLP 라고도 합니다.

여기서 자연어란, 사람이 평소에 말하는 음성이나 텍스트를 뜻합니다.

그렇다면 자연어 처리란, 음성이나 텍스트를 컴퓨터가 인식하고 처리하는 것을 뜻합니다.


  • 쉽게 말하자면, AI에게 한국어를 학습 시켜 단어 하나 하나가 아닌 문단과 문장의 흐름을 이해할 수 있습니다.

  • 그렇게 되면 글의 의미를 파악하는 요약분류를 수행할 수 있습니다.

  • 따라서 TwinDoc을 통해 데이터 분석가 및 현장 업무 담당자를 위한 신속한 문서 처리와 운영 환경을 제공 받을 수 있습니다.



  • TwinDoc library는 model개발이 목표입니다.

따라서, 자연어 처리 인공지능(AI) model이 개발되었습니다.


  • 한국어 데이터를 TwinDoc library로 model 개발하고, 그 결과로 text 분석을 도출하게 됩니다.

TwinDoc에서는 분류요약, 개체명 인식이 가능하게 됩니다.


  • 현재 TwinDoc에서는 model 학습 및 개발이 가능하고, 나아가 model 배포와 관리를 할 수 있습니다.


Model 학습이란?
Input 값으로 정답이 있는 Dataset와 Pre-Trained model, Parameter를 주게 되면
Output 값으로 fine-tuned model을 확인할 수 있습니다.



마무리

  • AgileSoDA의 TwinDoc이 무엇 인지에 대해 알아보았습니다.

아티클이 유용했나요?

훌륭합니다!

피드백을 제공해 주셔서 감사합니다.

도움이 되지 못해 죄송합니다!

피드백을 제공해 주셔서 감사합니다.

아티클을 개선할 수 있는 방법을 알려주세요!

최소 하나의 이유를 선택하세요
CAPTCHA 확인이 필요합니다.

피드백 전송

소중한 의견을 수렴하여 아티클을 개선하도록 노력하겠습니다.

02-558-8300