Spaces:

nsfwalex
/

whisper-transcribe-new

Runtime error

liuyang commited on Sep 19

Commit

e79159f

1 Parent(s): e3d9c9e

Add audio diarization task to Gradio interface: Introduced a new button and function for audio diarization, allowing users to process audio with speaker separation. Updated existing button labels for clarity.

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1316,8 +1316,20 @@ def format_segments_for_display(result):
     return output
 @spaces.GPU
-def process_audio_gradio(task_json, num_speakers, language, translate, prompt, group_segments, use_diarization, batch_size, model_name):
     """Gradio interface function"""
     result = transcriber.process_audio_transcribe(
@@ -1421,7 +1433,8 @@ with demo:
                     value=True
                 )
-            process_btn = gr.Button("🚀 Transcribe Audio", variant="primary")
         with gr.Column():
             output_text = gr.Markdown(
@@ -1443,7 +1456,7 @@ with demo:
     # Event handlers
     process_btn.click(
-        fn=process_audio_gradio,
         inputs=[
             task_json_input,
             num_speakers,
@@ -1457,6 +1470,15 @@ with demo:
         ],
         outputs=[output_text, output_json]
     )
     # Examples
     gr.Markdown("### 📋 Usage Tips:")

     return output
+@spaces.GPU
+def audio_diarization_task(task_json, num_speakers):
+    """Gradio interface function"""
+    result = transcriber.process_audio_diarization(
+            task_json=task_json,
+            num_speakers=num_speakers if num_speakers > 0 else None,
+        )
+    #formatted_output = format_segments_for_display(result)
+    return "OK", result
 @spaces.GPU
+def audio_transcribe_task(task_json, num_speakers, language, translate, prompt, group_segments, use_diarization, batch_size, model_name):
     """Gradio interface function"""
     result = transcriber.process_audio_transcribe(
                     value=True
                 )
+            process_btn = gr.Button("🚀 Audio Transcribe Task", variant="primary")
+            process_btn1 = gr.Button("🚀 Audio Diarization Task", variant="primary")
         with gr.Column():
             output_text = gr.Markdown(
     # Event handlers
     process_btn.click(
+        fn=audio_transcribe_task,
         inputs=[
             task_json_input,
             num_speakers,
         ],
         outputs=[output_text, output_json]
     )
+    process_btn1.click(
+        fn=audio_diarization_task,
+        inputs=[
+            task_json_input,
+            num_speakers
+        ],
+        outputs=[output_text, output_json]
+    )
     # Examples
     gr.Markdown("### 📋 Usage Tips:")