콘텐츠로 이동
📣 인포그랩에서 OpenAI 기술 기반으로 자체 개발한 자동화 번역 프로그램을 통해 n8n 공식 문서의 한글판을 국내 최초로 제공합니다.

OpenAI 오디오 작업#

이 작업을 사용하여 OpenAI에서 오디오를 생성하거나 녹음을 전사하거나 번역합니다. OpenAI 노드 자체에 대한 자세한 내용은 OpenAI를 참조하세요.

오디오 생성#

이 작업을 사용하여 텍스트 프롬프트에서 오디오를 생성합니다.

다음 매개변수를 입력하세요:

  • 연결할 자격 증명: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
  • 리소스: Audio를 선택하세요.
  • 작업: Generate Audio를 선택하세요.
  • 모델: 오디오 생성을 위해 사용할 모델을 선택하세요. 자세한 정보는 TTS | OpenAI를 참조하세요.
    • TTS-1: 속도를 최적화하려면 이 모델을 사용하세요.
    • TTS-1-HD: 품질을 최적화하려면 이 모델을 사용하세요.
  • 텍스트 입력: 오디오 생성을 위한 텍스트를 입력하세요. 최대 길이는 4096자입니다.
  • 음성: 오디오 생성을 위해 사용할 음성을 선택하세요. Text to speech guide | OpenAI에서 음성 미리보기를 들어보세요.

옵션#

  • 응답 형식: 오디오 응답 형식을 선택하세요. MP3(기본값), OPUS, AAC, FLAC, WAV, PCM 중에서 선택하세요.
  • 오디오 속도: 생성된 오디오의 속도를 0.25에서 4.0 사이의 값으로 입력하세요. 기본값은 1입니다.
  • 출력을 필드에 넣기: 기본값은 data입니다. 이진 파일 데이터를 넣을 출력 필드의 이름을 입력하세요.

자세한 정보는 Create speech | OpenAI 문서를 참조하세요.

녹음 전사#

이 작업을 사용하여 오디오를 텍스트로 전사합니다. OpenAI API는 오디오 파일 크기를 25 MB로 제한합니다. OpenAI는 기본적으로 whisper-1 모델을 사용합니다.

다음 매개변수를 입력하세요:

  • 연결할 자격 증명: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
  • 리소스: Audio를 선택하세요.
  • 작업: Transcribe a Recording을 선택하세요.
  • 입력 데이터 필드 이름: 기본값은 data입니다. .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav 또는 .webm 형식의 오디오 파일이 포함된 이진 속성의 이름을 입력하세요.

옵션#

  • 오디오 파일의 언어: ISO-639-1로 입력 오디오의 언어를 입력하세요. 이 옵션을 사용하여 정확성과 지연 시간을 개선하세요.
  • 출력 무작위성(온도): 기본값은 1.0입니다. 응답의 무작위성을 조정합니다. 범위는 0.0(결정적)에서 1.0(최대 무작위성)입니다. 이 옵션과 출력 무작위성(Top P) 중 하나를 조정하는 것이 좋습니다. 중간 온도(약 0.7)로 시작하고 관찰하는 출력에 따라 조정하세요. 응답이 너무 반복적이거나 경직되면 온도를 높이세요. 너무 혼란스럽거나 잘못된 경우 온도를 낮추세요.

자세한 정보는 Create transcription | OpenAI 문서를 참조하세요.

녹음 번역#

이 작업을 사용하여 오디오를 영어로 번역합니다. OpenAI API는 오디오 파일 크기를 25MB로 제한합니다. 기본적으로 OpenAI는 whisper-1 모델을 사용합니다.

다음 매개변수를 입력하세요:

  • 연결할 자격 증명: 기존 OpenAI 자격 증명을 생성하거나 선택하세요.
  • 리소스: 오디오를 선택하세요.
  • 작업: 녹음 번역을 선택하세요.
  • 입력 데이터 필드 이름: 기본값은 data입니다. .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav 또는 .webm 형식의 오디오 파일을 포함하는 이진 속성의 이름을 입력하세요.

옵션#

  • 출력 무작위성 (온도): 기본값은 1.0입니다. 응답의 무작위성을 조정합니다. 범위는 0.0 (결정론적)에서 1.0 (최대 무작위성)까지입니다. 둘 중 하나인 출력 무작위성 (온도) 또는 출력 무작위성 (Top P)를 조정하는 것을 권장하지만 둘 다는 아닙니다. 중간 온도(약 0.7)에서 시작하고 관찰한 출력에 따라 조정하세요. 응답이 너무 반복적이거나 경직된 경우 온도를 높이세요. 너무 혼란스럽거나 방향을 잃은 경우 온도를 낮추세요.

자세한 정보는 음성 텍스트 변환 생성 | OpenAI 문서를 참조하세요.

일반 문제#

일반적인 오류나 문제 및 권장 해결 단계를 보려면 일반 문제를 참조하세요.

인포레터에서 최신 DevOps 트렌드를 격주로 만나보세요!