텍스트 정리1분 읽기
사전 치환
사전 치환은 인식 결과를 정해둔 규칙으로 원하는 표기로 바꾸는 결정적 후처리 단계입니다.
사전 치환 인식된 텍스트를 정해둔 규칙으로 원하는 표기로 바꾸는 단계입니다.
무엇을 해결하나
확률 기반 모델은 비슷하게 들리는 용어를 흔들릴 수 있습니다. 사전 치환은 이런 흔들림을 고정된 규칙으로 바로잡아 결과를 더 예측 가능하게 만듭니다.
Mallo에서 어디에 유용한가
제품명, 회사명, 팀 약어, 한국어 문장 속 영문 용어처럼 반복되는 표현을 안정적으로 지키는 데 유용합니다. 특히 다국어 입력에서 체감 차이가 큽니다.
자주 생기는 오해
- 모든 오류를 규칙으로 처리하려고 함 사전 치환은 고정 용어에 강하고, 일반 인식 오류 전체를 대신하진 않습니다.
- 규칙을 너무 많이 넣음 관리 비용과 충돌 가능성이 빠르게 커집니다.
- 문맥 충돌 무시 짧은 표현은 다른 문장에서도 오작동할 수 있습니다.
FAQ
자주 묻는 질문
음성 인식과 같은 개념인가요?
아닙니다. 인식은 추정이고, 사전 치환은 그 결과를 규칙으로 고정하는 단계입니다.
왜 필요한가요?
브랜드명, 제품명, 팀 용어는 좋은 모델도 흔들릴 수 있기 때문입니다.
Mallo에서 어떤 가치가 있나요?
반복적으로 같은 수정을 하는 시간을 줄여줍니다.