아티클 관련 제품: TwinReader
들어가며
- Twinreader UI를 활용하여 Template 작성하는 방법 중 정보 인식 단계에 대해 알아보겠습니다.
- 정보 인식 단계에는 키워드로 추출, 체크박스 데이터 추출, 가장 큰 테이블 데이터 추출 규칙이 있습니다.
사전 준비 단계
- Category 작성 후 아래 단계를 진행해 주시고 자세한 내용은 Category 생성하기 항목을 참고하여 주시기 바랍니다.
- 정규표현식과 관련한 자세한 내용은 Template 작성하기 - 정규표현식 항목을 참고하여 주시기 바랍니다.
Template 생성하기
Template 화면에서 오른쪽 상단에 New를 선택하여 작성합니다.
Checkbox data 추출
checkbox data 추출은 적합한 값을 찾아 선정하고 keyword를 찾아 데이터를 추출하는 기능입니다.
- checkbox에서 탐색 허용 범위를 지정할 수 있습니다.
Keyword로 data 추출
keyword로 data 추출은 keyword를 기반으로 데이터를 추출하는 기능입니다.
- 찾을 키워드 : 추출한 데이터에서 검색할 keyword를 설정합니다.
- 참조 키워드 : 찾을 키워드 다음으로 연관 keyword를 참조하는 키워드 입니다.
- 탐색 허용 범위 : 참조 키워드의 탐색 허용 범위를 나타내며 최대 5까지 탐색 가능합니다.
- 데이터를 찾을 방향
- 전체 : keyword 검색 뱡향이 오른쪽, 아래쪽 모두 검색합니다.
- 오른쪽 : keyword 검색 방향이 오른쪽입니다.
- 아래쪽 : keyword 검색 방향이 아래쪽입니다. - 추출 데이터 타입 지정
- 숫자 : 0 ~ 9까지 숫자만 허용합니다.
- 문자 : 일반적인 문자 형태로 인식 단어 변환에 정의되어 있는 값을 제외한 모든 값을 허용합니다.
- 규칙 : 특정 pattern이 있는 형식으로 정규식으로 정의하여 사용합니다. - 추출데이터필터 & 동일 행/열 데이터 라벨 설정
○ 찾을 키워드와 연관된 label과 찾을 키워드와 같은 행 또는 열의 label을 설정하여 데이터 추출할 때 사용합니다.
가장 큰 table data 추출
가장 큰 테이블 데이터 추출은 특정 column을 기준으로 전체 행의 값을 추출하고 다른 column의 값을 연관 정보로 추출하여 테이블의 전체 데이터를 추출합니다.
- 빨간색 Box안에 데이터들이 추출되게 됩니다.
- 가장 큰 테이블 데이터를 추출하기 위해서 사전 작업으로 Template 작성하기 1이 선행되어야 합니다.
선택적 추출
선택적 추출은 앞선 3단계를 그룹화하고 데이터를 선택하여 추출하는 단계입니다.
- 추출 결과 선택
- 전체 : 앞의 3단계(키워드로 데이터 추출, checkbox 데이터 추출, 가장 큰 테이블 데이터 추출)에서 수행한 결과 전부를 선택합니다.
- 첫 번째 결과 : 앞의 3단계(키워드로 데이터 추출, checkbox 데이터 추출, 가장 큰 테이블 데이터 추출)에서 수행하면서 얻은 결과 값 중 첫 번째 결과 값을 선택합니다. - 규칙
- 그룹화 시킬 앞의 3단계를 선택하고 인덱스 순으로 수행하여 결과 값을 추출합니다.
- 결과
- 진료비 총액
- 합계
마무리
- Template 작성하는 방법 중 정보 인식 단계에 대해 알아보았습니다.
- 다음 단계인 후 처리 과정에 대하여 Plugin 작성하기를 참고하시기 바랍니다.
아티클이 유용했나요?
훌륭합니다!
피드백을 제공해 주셔서 감사합니다.
도움이 되지 못해 죄송합니다!
피드백을 제공해 주셔서 감사합니다.
피드백 전송
소중한 의견을 수렴하여 아티클을 개선하도록 노력하겠습니다.