converting Audio to Text
Whisper라는 openAI Tool을 활용하는건데 Local Resource 활용해서 엄청 느린듯
- git 설치 확인, python 설치 확인
- whisper-webui 설치 확인
pip install git+https://github.com/openai/whisper.git
git --version
- ffmpeg 설치 확인 (.m4a 확장자 처리용)
- https://www.gyan.dev/ffmpeg/builds/ → release builds → essentials download
- 원하는 위치에 압축 풀기 (C:\Program Files\ffmpeg-7.1.1-essentials_build\bin)
- 위에 bin 경로까지를 환경 변수 path에 추가
- cmd창 ffmpeg -version으로 확인
- 변환 시작
- —model은 base<small<medium<large 이런식이고, —task transcribe는 내용 그대로 써라 라는 뜻
whisper "DSA_250409_1.m4a" --model small --language English --task transcribe --output_format txt
다른 방법으로는 NaverClova 쓸 수 있는데, Free Trial만 가능한 듯