TwinDoc이 무엇인가요?

작성자 김아름 수정일 2022-10-28 08:53

들어가며

TwinDoc이란, AI Transformer 기반의 자연어 처리 platform 입니다.

Transformer model은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적하여 맥락과 의미를 학습하는 신경망 입니다.

한 문장이 Transformer로 입력되면, 여러 인코더 블록과 디코더 블럭을 통과하여 특정 문장으로 출력됩니다.

인코더 블록과 디코더 블록의 구조는 각 입력된 문장 내 단어 간의 관계를 보여주는 self-attention layer와

모든 단어들에 동일하게 적용되는 fully connected feed-foward layer로 구성되어 있습니다.

추가로 디코더 블록에는 encoder-decoder attention layer가 두 layer 사이에 들어가 있습니다.

자연어 처리는 Natural Language Proccessiong으로, NLP 라고도 합니다.

여기서 자연어란, 사람이 평소에 말하는 음성이나 텍스트를 뜻합니다.

그렇다면 자연어 처리란, 음성이나 텍스트를 컴퓨터가 인식하고 처리하는 것을 뜻합니다.

따라서, 자연어 처리 인공지능(AI) model이 개발되었습니다.

TwinDoc에서는 분류와 요약, 개체명 인식이 가능하게 됩니다.

Model 학습이란?
Input 값으로 정답이 있는 Dataset와 Pre-Trained model, Parameter를 주게 되면
Output 값으로 fine-tuned model을 확인할 수 있습니다.