Oszczędzaj czas dzięki wbudowanej funkcji transkrypcji programu Microsoft Word

Opublikowany: 2022-01-29

Firma Microsoft ogłosiła niedawno nową funkcję w programie Word, która automatycznie transkrybuje pliki audio, w szczególności rozmowy między dwoma lub więcej mówcami. W przypadku osób, które regularnie nagrywają wywiady, przemówienia i inne konwersacje, to nowe narzędzie do transkrypcji umożliwia uzyskanie pisemnego tekstu plików audio przy bardzo niewielkim nakładzie pracy i bez dodatkowych kosztów, co zwiększa produktywność.

Poświęciłem nową funkcję i muszę przyznać, że nawet przy kilku problemach z pierwszym uruchomieniem zaoszczędziło mi to od jednej do dwóch godzin na 22-minutowe nagranie. Dodatkowo, dzięki sposobowi zaimplementowania tej funkcji, łatwo jest słuchać pliku audio i jednocześnie wprowadzać poprawki do tekstu. Uważam, że funkcja transkrypcji Worda jest niezwykle przydatną oszczędnością czasu. Oto, co musisz o nim wiedzieć, jak go zdobyć i jak z niego korzystać.

Jak uzyskać transkrypcję dla programu Word

Transkrypcja do programu Word jest obecnie dostępna w internetowej wersji programu Microsoft Word i aby ją uzyskać, musisz być subskrybentem usługi Microsoft 365. Aby uzyskać dostęp do tej funkcji, musisz również użyć przeglądarki Chrome lub Microsoft Edge. Aby znaleźć narzędzie, przejdź do paska narzędzi Strona główna i poszukaj po prawej stronie funkcji Dyktuj. Kliknij go i znajdź opcję Transkrybuj z krótkiego menu rozwijanego (jest to drugi wybór).

W chwili pisania tego tekstu Transkrypcja jest dostępna tylko w amerykańskim języku angielskim, jednak w przyszłości będzie działać z dowolnym językiem ustawionym jako preferencje w programie Word. Nie ma ograniczeń co do rozmiaru pliku, który możesz przesłać. Wreszcie, aby ta funkcja działała, potrzebujesz połączenia z Internetem.

Transkrypcja dźwięku w programie Microsoft Word

Co to jest transkrypcja i czym różni się od dyktowania?

Transkrypcja to nowa funkcja, która umożliwia transkrypcję pliku audio na tekst. Możesz nagrać dźwięk bezpośrednio w programie Word lub przesłać plik audio nagrany w innym miejscu.

Czym różni się od funkcji Dyktuj? Dyktando interpretuje jedną osobę mówiącą. Transkrypcja obsługuje wielu głośników. Dyktowanie to coś, co robisz zamiast pisać, ale zwykle wciąż zastanawiasz się, w jaki sposób zamienisz swoje słowa w końcowy tekst. Kiedy używasz narzędzia Transkrypcja, prawdopodobnie zechcesz skupić się na rozmowie i zachować na później swoje przemyślenia na temat tego, jak użyjesz tych słów w końcowym utworze.

Bezpieczeństwo i prywatność dzięki Microsoft Transscribe

W jaki sposób firma Microsoft przekształca dźwięk w tekst i czy jest on prywatny i bezpieczny? Według briefingu prasowego firma wykorzystuje sztuczną inteligencję, a nie ludzi do transkrypcji dźwięku. Każdy przesłany lub nagrany plik zostanie zapisany na Twoim koncie OneDrive. Poszukaj nowego folderu o nazwie Transkrybowane pliki w OneDrive. Pliki te są chronione tą samą polityką prywatności, co inne pliki zapisywane w OneDrive.

Gdy udostępniasz komuś dokument programu Word i zawiera on transkrybowany plik, odbiorca może zobaczyć wszystko w okienku Transkrypcja. Innymi słowy, widzą pełny, oryginalnie transkrybowany tekst w blokach tekstowych ze znacznikami czasu. Nie mogą jednak odtworzyć pliku audio.

Pełna transkrypcja Microsoft Word

Jak działa Microsoft Transscribe?

Jak wspomniano, możesz nagrywać rozmowy z programu Word lub przesyłać plik audio do transkrypcji. Przetestowałem tę funkcję, przesyłając 22-minutowy plik, a transkrypcja zajęła około 30 minut. Jeśli jednak nagrywasz w czasie rzeczywistym za pomocą programu Word, aplikacja wysyła fragmenty dźwięku do transkrybatora AI w trakcie podróży, co oznacza, że ​​ostateczną transkrypcję otrzymujesz znacznie szybciej.

Jeśli chodzi o sterowanie odtwarzaniem, możesz słuchać pliku audio bezpośrednio w oknie programu Word, a także wstrzymywać, przeskakiwać do przodu lub do tyłu w pięciosekundowych odstępach. Możesz także przeskoczyć do przodu lub do tyłu w dowolnym miejscu pliku, klikając dźwięk wiersz odtwarzania pliku. Gdy przejdziesz do nowego miejsca w pliku audio, który jest już transkrybowany, aplikacja automatycznie przeskakuje do pasującego tekstu poniżej. Możesz spowolnić odtwarzanie do połowy szybkości lub przyspieszyć je 1,25, 1,5 i 2,0 razy.

W moim pliku testowym i innych demach, które oglądałem od Microsoftu, aplikacja była całkiem niezła w rozróżnianiu głosów. Mój plik testowy miał dwa głośniki żeńskie. Aplikacja początkowo zdecydowała, że ​​były trzy osoby. Oznacza ludzi jako Mówca 1, Mówca 2 i tak dalej. W końcu aplikacja błędnie zidentyfikowała tylko jedną linię jako od trzeciego głośnika, więc bardzo łatwo było to poprawić.

Polecane przez naszych redaktorów

Aplikacja Tłumacz Google do transkrypcji i tłumaczenia w czasie rzeczywistym
Zorganizuj się: narzędzia do lepszych spotkań
Co to jest Microsoft 365?

Ostateczna transkrypcja pojawia się w panelu po prawej stronie dokumentu, a nie w samym dokumencie. W ten sposób możesz dołączyć całą transkrypcję lub tylko niektóre cytaty.

Wskazówki i porady dotyczące Microsoft Transkrypcja

Oto kilka wskazówek dotyczących wydajnej pracy z nowym narzędziem Transkrypcja.

  1. Zmień nazwę Głośnik 1, Głośnik 2 Najpierw. Przed przystąpieniem do jakiejkolwiek innej edycji należy zmienić nazwę Głośnik 1, Głośnik 2 itd. w panelu Transkrypcja. Możesz to zrobić raz, a następnie zdecydować się na poprawienie wszystkich wystąpień. Jeśli masz więcej niż dwóch głośników, prawdopodobnie powinieneś dokładnie sprawdzić wszystkie cytaty, których używasz, słuchając dźwięku i upewniając się, że głos jest zgodny z nazwą, ponieważ nadal może się nie udać.

  2. Dodaj tekst do dokumentu kawałek po kawałku lub wszystko na raz. Każdy transkrybowany blok tekstu ma w swoim bloku znak plus. Gdy klikniesz ten znak plus, doda tekst do dokumentu w miejscu, w którym znajduje się kursor. Alternatywnie możesz dodać cały tekst do dokumentu, wybierając opcję na dole panelu, która mówi Dodaj wszystko do dokumentu.

  3. Zwróć uwagę na znaczniki czasu. Każdy transkrybowany blok tekstu ma sygnaturę czasową. Są one przydatne, gdy chcesz wykonać kopię zapasową dźwięku, aby ponownie odsłuchać i upewnić się, że sztuczna inteligencja poprawnie przepisała tekst.

  4. Sprawdź losową wielkość liter. Jednym z najczęstszych błędów, jakie widziałem, była losowa kapitalizacja słów. Zwróć uwagę podczas edytowania ostatecznej kopii.

  5. Złe słowa urywają się. Moja transkrypcja testowa zawierała frazę „piss pouring”, a transkrypcja wyszła jako „**** wylewanie”. W zależności od tego, jak zamierzasz użyć końcowego dokumentu, możesz chcieć zwracać uwagę na przerywane słowa.

Wspomaganie produktywności

Następnym razem, gdy będziesz musiał przepisać wywiad lub chcesz nagrać i wpisać transkrypcję spotkania, możesz użyć programu Word, aby zrobić to bez dodatkowych kosztów (o ile jesteś subskrybentem Microsoft 365) i o wiele mniej wysiłku niż robienie tego ręcznie.

W przypadku grup dokonujących zbiorczej transkrypcji dźwięku lepszym rozwiązaniem może być usługa transkrypcji. Niektóre z tych usług są nawet bezpłatne. Usługa Office 365 nie jest darmowa, ale dla właściwego użytkownika posiadanie wbudowanej funkcji transkrypcji, która jest tak ściśle zintegrowana z programem Word, zmienia zasady gry.