added speaker diarization for amazon, not in CLI yet

2019-03-07 23:38:29 -05:00
parent d029e6ccea
commit 9952f5fe4b
2 changed files with 21 additions and 5 deletions
--- a/setup.py
+++ b/setup.py
@@ -6,7 +6,7 @@ with open('README.md') as file:

 setup(
    name="tatt",
-    version="0.974",
+    version="0.975",
    py_modules=['tatt'],
    url='https://github.com/zevaverbach/tatt',
    install_requires=[
--- a/tatt/vendors/amazon.py
+++ b/tatt/vendors/amazon.py
@@ -70,10 +70,10 @@ class Transcriber(TranscriberBaseClass):
    def make_bucket(cls, bucket_name):
        cls.s3.create_bucket(Bucket=bucket_name)

-    def transcribe(self) -> str:
+    def transcribe(self, **kwargs) -> str:
        self._upload_file()
        try:
-            return self._request_transcription()
+            return self._request_transcription(**kwargs)
        except self.tr.exceptions.ConflictException:
            raise exceptions.AlreadyExistsError(
                f'{self.basename} already exists on {NAME}')
@@ -83,9 +83,15 @@ class Transcriber(TranscriberBaseClass):
                str(self.filepath),
                self.basename)

-    def _request_transcription(self, language_code='en-US') -> str:
+    def _request_transcription(
+            self, 
+            language_code='en-US', 
+            num_speakers=2,
+            enable_speaker_diarization=True,
+            ) -> str:
        job_name = self.basename
-        self.tr.start_transcription_job(
+
+        kwargs = dict(
                TranscriptionJobName=job_name,
                LanguageCode=language_code,
                MediaFormat=self.basename.split('.')[-1].lower(),
@@ -94,6 +100,16 @@ class Transcriber(TranscriberBaseClass):
                    },
                OutputBucketName=self.bucket_names['transcript']
                )
+
+        if enable_speaker_diarization:
+            kwargs.update(dict(
+                Settings={
+                    'ShowSpeakerLabels': True,
+                    'MaxSpeakerLabels': num_speakers,
+                    }
+                    ))
+
+        self.tr.start_transcription_job(**kwargs)
        return job_name

    @classmethod