아티클 관련 제품: TwinReader
들어가며
- Twinreader UI를 활용하여 Template 작성하는 방법 중 전 처리 단계에 대해 알아보겠습니다.
- 전 처리 단계에는 공통, 삭제 대상 패턴, 인식 단어 변환, 분리 규칙이 있습니다.
사전 준비 단계
- Twinreader UI에 로그인 한 뒤 Category 생성까지 완료한 후 진행하여 주시기 바랍니다.
- Category 작성에 대한 자세한 내용은 Category 생성하기 항목을 참고하여 주시기 바랍니다.
- 정규표현식과 관련한 자세한 내용은 Template 작성하기 - 정규표현식 항목을 참고하여 주시기 바랍니다.
Template 생성하기
Template 화면에서 오른쪽 상단에 New를 선택하여 작성합니다.
공통
공통은 정보 추출의 정확도를 높이기 위한 기능으로 허용 문자 이외의 모든 문자를 제거합니다.
- 분석 허용 특수 문자 : 정보 추출 시 허용할 특수 문자를 입력합니다.
- 분석 허용 문자 규칙 : 허용할 문자를 선택합니다.
- 분석 미허용 규칙 : 분석 허용 문자 처리 후 제거할 문자를 정규식으로 입력합니다.
삭제 대상 패턴
삭제 대상 패턴은 이용하지 않을 문자를 제거하기 위해 사용하며 정규표현식으로 정의합니다.
- 신뢰 임계값 : 삭제 할 대상에 대한 신뢰도 값으로 0.1 ~ 1.0 사이의 값을 입력합니다.
인식 단어 변환
인식 단어 변환은 변환할 단어(=keyword)로 변경할 인식 단어들을 입력해 줍니다.
분리 규칙
분리 규칙은 하나의 셀에 잡힌 여러 개의 데이터 들 중 규칙에 맞는 경우 각각의 셀로 분리합니다.
분리 규칙에 해당되는 경우 → |
마무리
- Template 작성하는 방법 중 전 처리 단계에 대해 알아보았습니다.
- 다음 단계인 정보 인식에 관하여 Template 작성하기 2에서 다루어 보겠습니다.
아티클이 유용했나요?
훌륭합니다!
피드백을 제공해 주셔서 감사합니다.
도움이 되지 못해 죄송합니다!
피드백을 제공해 주셔서 감사합니다.
피드백 전송
소중한 의견을 수렴하여 아티클을 개선하도록 노력하겠습니다.