• converting Audio to Text

    Whisper라는 openAI Tool을 활용하는건데 Local Resource 활용해서 엄청 느린듯

    1. git 설치 확인, python 설치 확인
    2. whisper-webui 설치 확인
    pip install git+https://github.com/openai/whisper.git
    git --version
    
    1. ffmpeg 설치 확인 (.m4a 확장자 처리용)
    • https://www.gyan.dev/ffmpeg/builds/ → release builds → essentials download
    • 원하는 위치에 압축 풀기 (C:\Program Files\ffmpeg-7.1.1-essentials_build\bin)
    • 위에 bin 경로까지를 환경 변수 path에 추가
    • cmd창 ffmpeg -version으로 확인
    1. 변환 시작
    • —model은 base<small<medium<large 이런식이고, —task transcribe는 내용 그대로 써라 라는 뜻
    whisper "DSA_250409_1.m4a" --model small --language English --task transcribe --output_format txt
    

    다른 방법으로는 NaverClova 쓸 수 있는데, Free Trial만 가능한 듯