로컬 우선 음성 인식
로컬 우선 음성 인식은 음성 처리를 기본적으로 기기 안에서 수행하는 구조를 뜻합니다.
Mac 받아쓰기, 음성 타이핑, 음성 인식, 텍스트 정리, 그리고 Mallo를 더 잘 쓰기 위한 핵심 워크플로 용어를 한곳에 모았습니다.
먼저 읽기
로컬 우선 음성 인식은 음성 처리를 기본적으로 기기 안에서 수행하는 구조를 뜻합니다.
받아쓰기는 말한 내용을 텍스트로 바꾸는 음성 입력 흐름입니다.
음성 인식은 오디오 신호를 텍스트로 바꾸는 기반 기술입니다.
음성 타이핑은 키보드 대신 말해서 현재 앱 안에 바로 텍스트를 입력하는 방식입니다.
전체 용어
게시된 용어 26개
기록 보존 기간은 과거 받아쓰기 결과를 얼마나 오래 저장하고 다시 볼 수 있게 둘지 정하는 규칙입니다.
다국어 받아쓰기는 둘 이상의 언어를 실제 작업 흐름 안에서 처리하는 음성 입력을 뜻합니다.
로컬 우선 음성 인식은 음성 처리를 기본적으로 기기 안에서 수행하는 구조를 뜻합니다.
마이크 권한은 앱이 사용자의 마이크 오디오를 받을 수 있게 하는 macOS 개인정보 보호 권한입니다.
모델 선택은 현재 받아쓰기를 어떤 음성 모델이 처리할지 정하는 제품적 선택을 뜻합니다.
사전 치환은 인식 결과를 정해둔 규칙으로 원하는 표기로 바꾸는 텍스트 정리 단계입니다.
손쉬운 사용 권한은 macOS 앱이 UI 요소와 상호작용하게 해 주며, 여러 앱에 걸친 안정적인 텍스트 삽입에 필요할 수 있습니다.
수식 키 전용 핫키는 Command나 Control 같은 수식 키만으로 받아쓰기를 시작하는 방식을 뜻합니다.
음성 인식은 오디오 신호를 텍스트로 바꾸는 기반 기술입니다.
음성 타이핑은 키보드 대신 말해서 현재 앱 안에 바로 텍스트를 입력하는 방식입니다.
음성 모델은 오디오에서 텍스트를 추정하는 핵심 엔진으로, 속도와 언어 적합도, 정확도에 큰 영향을 줍니다.
음성 입력은 손으로 타이핑하는 대신 말을 입력 수단으로 쓰는 넓은 개념입니다.
음성을 텍스트로 변환하는 것은 말한 오디오를 글자로 바꾸는 과정을 뜻합니다.
입력 모니터링은 전역 단축키 같은 기능을 위해 앱이 키 입력을 감지할 수 있게 해 주는 macOS 권한입니다.
전역 핫키는 특정 앱 안에서만이 아니라 macOS 전체에서 동작하는 단축키를 뜻합니다.
전체 화면 오버레이는 사용자가 전체 화면 앱 안에 있어도 계속 보이고 쓸 수 있는 UI를 뜻합니다.
커서 삽입은 생성된 텍스트가 별도 창이 아니라, 지금 커서가 있는 위치에 바로 들어가는 방식을 뜻합니다.
토글 받아쓰기는 한 번 켜면 사용자가 다시 멈출 때까지 받아쓰기가 계속 유지되는 방식입니다.
포커스 안전 삽입은 현재 활성 입력 필드를 확실히 식별했을 때만 받아쓰기 결과를 넣는 방식을 뜻합니다.
홀드 투 톡은 지정한 단축키를 누르고 있는 동안에만 받아쓰기가 동작하는 방식입니다.
Parakeet은 NVIDIA의 ASR 모델 계열로, 최신 음성 인식 모델 목록에서 자주 보이는 선택지입니다.
Qwen ASR은 다국어 받아쓰기와 최신 오픈 모델 흐름에서 쓰이는 Qwen 계열 음성 인식 모델을 가리킵니다.
whisper.cpp는 Whisper 계열 모델을 로컬 기기에서 실행하기 위한 온디바이스 추론 런타임입니다.