Hấp dẫn

Thoại qua văn bản - chương trình đọc văn bản với giọng nói trực tiếp (bộ tổng hợp giọng nói)

Tất cả sức khỏe!

Dân gian truyền tụng: “Từ xưa có sách nên người” ...

Ai sẽ không nói gì về thế giới kỹ thuật số hiện đại, rằng giấy sẽ sớm chết, v.v. - xét cho cùng, sách, theo tôi, sẽ hữu ích và phù hợp trong thời gian dài. Ngược lại, công nghệ hiện đại giúp bạn tìm thấy sách và thông tin mình cần một cách nhanh chóng và dễ dàng hơn.

Nhân tiện, bạn có thể tải toàn bộ thư viện vào một máy tính bảng và làm quen với nó ở bất cứ đâu, ví dụ: trên đường đi làm, ở nhà, ở trường, v.v.!

Nhưng có một điểm cộng khác mà phần mềm hiện đại mang lại cho chúng ta - đây là khả năng nghe sách , như thể một người thực đọc chúng cho bạn (nhân tiện, các chương trình như vậy được gọi là bộ tổng hợp giọng nói )! Công cụ giọng nói hiện đại cho phép bạn nghe văn bản bằng giọng nam, nữ, trẻ em. Về mọi thứ, chi tiết hơn bên dưới ...

👉 Quan trọng!

Để các ứng dụng được trình bày dưới đây có thể đọc văn bản của một cuốn sách (tạp chí, báo, v.v.) của bạn, cần phải có một công cụ giọng nói (bộ tổng hợp). Những, cái đó. bạn cần cả một trình đọc và một công cụ để hoạt động!

Nhân tiện, chất lượng của việc đọc trực tiếp phụ thuộc vào phần sau (để không có "be-me", bạn cần chọn một công cụ giọng nói tốt). Thông tin chi tiết về động cơ PC có trong phần thứ hai của bài viết này.

*

Bộ tổng hợp giọng nói: nên chọn những gì

Cho điện thoại

Chuyển văn bản thành giọng nói của Google

Liên kết với Play Market ->

Sản phẩm này được tích hợp sẵn trên nhiều điện thoại thông minh theo mặc định (mặc dù nó không phải lúc nào cũng được liệt kê là bộ tổng hợp mặc định). Trong chuong "Ngôn ngữ và Đầu vào" kiểm tra kỹ xem bạn đã đặt nó làm mô-đun ưa thích chưa (trong trường hợp của tôi, động cơ của Samsung đã được sử dụng, ví dụ trên ảnh chụp màn hình bên dưới 👇).

Cài đặt Android 10 - ngôn ngữ và phương thức nhập

Đối với việc sử dụng - sau đó với sự trợ giúp của nó, bạn sẽ có thể lồng tiếng cho các văn bản:

  1. trên Google Play Sách;
  2. trong Google Dịch (hơn nữa, bạn có thể nghe văn bản / từ nước ngoài);
  3. trong nhiều ứng dụng đọc mà bạn có thể tải xuống từ Play Market và các ứng dụng tương tự của nó (tất nhiên, bạn sẽ cần nhớ chỉ định bộ tổng hợp bạn cần trong cài đặt ứng dụng).

*

Trình đọc to bằng giọng nói

Liên kết với Play Market ->

Một ứng dụng rất chắc chắn có khả năng đọc văn bản từ nhiều nguồn khác nhau: trang web, bài báo (tài liệu), email, SMS, PDF, FB2, MOBI, v.v.

Voice Aloud Reader - ảnh chụp màn hình của ứng dụng

Sử dụng ứng dụng vô cùng dễ dàng và tiện lợi: tải tài liệu mong muốn về điện thoại, thêm vào thư viện Voice Aloud Reader, mở và bắt đầu đọc. Mọi điều!

Tôi cũng muốn lưu ý rằng ứng dụng có tích hợp riêng quản lý giọng nói (tuy nhiên, âm thanh của nó khiến nhiều người mong muốn và tôi khuyên bạn nên thay thế nó bằng một sản phẩm của Google 👆).

Nhân tiện, nếu muốn, bạn có thể sử dụng nhiều giọng nói cùng một lúc (đối với điều này, bạn cần cài đặt ít nhất một vài bộ tổng hợp khác nhau: Acapela, Ivona Google TTS, SVOX TTS, v.v.). Tất cả những thứ này đều có trên Chợ Play ...

*

TTS Reader (dành cho sách)

Liên kết với Play Market ->

Trình đọc sách đa năng (hỗ trợ các định dạng: TXT, FB2, PDF, DJVU, EPUB, RTF, HTML, v.v.).

Tôi thích nhất ở thư viện của nó: thứ nhất, tất cả sách của bạn sẽ được sắp xếp (và bạn có thể dễ dàng tìm thấy cuốn mình cần), thứ hai, bạn có thể tìm kiếm sách mới ngay trong chương trình. Thuận tiện ?!

Làm thế nào để bắt đầu đọc bằng tai! Người đọc TTS

Đối với việc đọc to, mọi thứ đều đơn giản ở đây! Khi bạn mở cuốn sách mong muốn - hãy nhấp vào biểu tượng "đeo tai nghe" , chọn động cơ, tốc độ, âm lượng (và các thông số khác) và nhấn Play. 👆

Nhân tiện, nếu bạn cần ngắt và dừng đọc - các dấu trang thuận tiện được triển khai trong TTS Reader (tức là bạn luôn có thể tiếp tục ở nơi bạn đã dừng lại).

*

Dịch vụ trực tuyến

Yandex SpeechKit

Một giải pháp rất thú vị từ Yandex cho phép bạn lồng tiếng văn bản gồm 5000 ký tự bằng giọng nói của Alice. Tôi lưu ý rằng mặc dù âm lượng nhỏ, chất lượng đọc bản thân nó rất tốt: động cơ của họ làm tốt ngữ điệu và nhấn mạnh tốt.

Yandex SpeechKit - màn hình chính thức Địa điểm

Tất nhiên, dịch vụ này sẽ không cho phép bạn đọc toàn bộ cuốn sách, nhưng nếu bạn cần đọc một số bài báo trong nền, tại sao không ?! ...

*

Google dịch (tối đa 5 nghìn ký tự)

Trình dịch Yandex (tối đa 10 nghìn ký tự)

Không nhiều người chú ý đến thực tế là ngoài chức năng chính của chúng, trình dịch trực tuyến có thể được sử dụng để đọc các văn bản nhỏ (Yandex được ưu tiên hơn về mặt này, vì nó hỗ trợ tới 10 nghìn ký tự).

Ảnh chụp màn hình từ trang web của Google

*

Acapela

Miễn phí: chỉ 300 ký tự (tức là văn bản nhỏ)

Bộ tổng hợp khá tốt, nhưng phải trả phí. Anh ấy nói tiếng Nga bằng giọng của "Alyonka". Để thử nghiệm, bạn có thể sử dụng một văn bản nhỏ bằng cách tải lên thông số kỹ thuật. biểu mẫu trên trang chính của trang web (👇).

Acapela - đọc bài viết của tôi

Tuy nhiên, nếu bạn không bối rối bởi những hạn chế của phiên bản miễn phí, thì bạn cũng có thể sử dụng nó ... 👌

*

Chuyển văn bản thành giọng nói

Theo tôi, dịch vụ này phù hợp hơn với những người học ngoại ngữ. Nó cho phép bạn đọc to các văn bản bằng cả tiếng Nga và tiếng Anh, Đức, Ý và các ngôn ngữ khác.

Nhân tiện, chất lượng đọc vẫn thấp hơn so với các giải pháp trên ...

Ảnh chụp màn hình từ trang chính của trang web

*

Đối với PC / máy tính xách tay (chạy Windows) ✌

Đọc phần mềm

(lưu ý: để đọc văn bản)

Govorilka

Trang web: //www.vector-ski.ru/vecs/govorilka/

Một chương trình rất nhỏ được thiết kế để đọc văn bản bằng giọng nói. Chương trình có thể đọc văn bản bằng các ngôn ngữ khác nhau, tùy thuộc vào công cụ giọng nói bạn kết nối. Cung cấp khả năng tạo tệp MP3 (ví dụ: tạo sách nói, rất phổ biến gần đây).

Cửa sổ chính của chương trình "Govorilka"

Các tính năng chính:

  1. đọc văn bản từ các tệp khác nhau: DOS và Windows được mã hóa; văn bản có thể đọc được có kích thước lên đến 2 GB; mở tệp Word, Html;
  2. khả năng điều chỉnh tốc độ đọc, cao độ giọng nói, âm lượng, v.v.;
  3. khả năng ghi lại văn bản có thể đọc được ở định dạng MP3 (nhân tiện, bạn có thể ghi với tốc độ cao hơn);
  4. chương trình tự động lật qua các trang (văn bản) của cuốn sách khi bạn đọc nó (và hiển thị nó cho bạn);
  5. có thể sửa các từ và cụm từ riêng lẻ, chúng cần được phát âm chính xác như thế nào;
  6. khi đóng chương trình, nó sẽ tự động ghi nhớ vị trí con trỏ cuối cùng;
  7. hoàn toàn bằng tiếng Nga, hoạt động trên tất cả các phiên bản Windows 7, 8, 10 hiện đại.

Demgeon

Trang web: //aloys.narod.ru/part3.htm

Chương trình này là 2 trong 1: nó là một trình soạn thảo văn bản có hỗ trợ Unicode và một trình tổng hợp giọng nói (tức là phần mềm để lồng tiếng cho văn bản) với sự hỗ trợ cho SAPI4 / SAPI5 (lưu ý: về động cơ, xem phần thứ hai của bài viết). Chương trình khác với nhiều đối thủ cạnh tranh của nó, bởi vì trong quá trình phát triển của nó, các thuật toán đặc biệt thay thế từ điển đã được sử dụng, điều này ảnh hưởng đến cách phát âm chính xác của văn bản đã đọc. Ngoài ra, Demvial có một công cụ kiểm tra chính tả không lời.

Demagog - đọc ví dụ // cửa sổ chính

Các tính năng chính của chương trình:

  1. đọc văn bản từ nhiều định dạng: MS Word, E-Book và HTML (hỗ trợ nhập ảnh);
  2. khả năng ghi các tập tin âm thanh ở các định dạng: WAV, MP3, OGG, WMA, MP4;
  3. khả năng kết nối codec âm thanh tùy chỉnh;
  4. nêu lỗi chính tả;
  5. hỗ trợ từ điển phát âm (định dạng DIC), khả năng chỉnh sửa chúng;
  6. Hỗ trợ 100% tiếng Nga;
  7. hoạt động trong hệ điều hành Windows XP, Vista, 7, 8, 10 (32/64 bit).

Balabolka

Trang web: //www.cross-plus-a.ru/balabolka.html

Mục đích chính của chương trình "Balabolki" là đọc các văn bản của sách, tài liệu, v.v. với giọng nói của "con người sống". Bất kỳ công cụ giọng nói nào được cài đặt trên PC của bạn đều có thể được sử dụng để đọc.

Các tính năng chính:

  1. Ngoài khả năng đọc "bình thường" (như các tiện ích khác vẫn làm), "Balabolka" có thể đọc văn bản từ khay nhớ tạm, hiển thị văn bản từ các tài liệu khác nhau, phát âm văn bản được gõ trên bàn phím;
  2. chỉ hỗ trợ một số lượng lớn các định dạng tệp: AZW, AZW3, CHM, DjVu, DOC, DOCX, EPUB, FB2, HTML, LIT, MOBI, ODT, PDB, PDF, PRC, RTF, TCR, WPD;
  3. có thể kiểm tra chính tả, chia tài liệu lớn thành nhiều tài liệu nhỏ, tìm kiếm các tài liệu đồng nhất;
  4. văn bản có thể được lưu dưới dạng tệp âm thanh định dạng: WAV, MP3, MP4, OGG và WMA;
  5. biết cách làm việc với các gói từ Microsoft Speech API (SAPI);
  6. bạn có thể thay đổi tốc độ và âm sắc của lời nói;
  7. hỗ trợ đầy đủ cho tiếng Nga;
  8. Hệ điều hành: Microsoft Windows XP / Vista / 7/8/10.

ICE Book Reader

Trang web: //www.ice-graphics.com/ICEReader/IndexR.html

ICE Book Reader là một trong những chương trình đọc văn bản mạnh mẽ nhất (cả bằng tai và đơn giản từ màn hình PC). Một trong những ưu điểm chính: chương trình tiết kiệm thị lực của bạn, giúp bạn có thể tùy chỉnh hiển thị văn bản từ sách sao cho thuận tiện nhất cho bạn (cỡ chữ, thụt lề, màu sắc, v.v. - hàng chục thông số khác nhau).

Ví dụ về việc đọc một cuốn sách

Đối với việc đọc to sách cho người dùng, tất nhiên ICE Book Reader có thể làm được (nếu không thì tôi sẽ không đưa nó vào bài đánh giá). Hỗ trợ công cụ thoại SAPI4 và SAPI5.

Ngoài việc đọc, nó có thể tạo các tệp MP3 / WAV từ một cuốn sách (sau đó có thể nghe trên bất kỳ máy nghe nhạc MP3 nào). Nhân tiện, khi tạo sách MP3, bạn không cần phải lưu trữ các tệp WAV lớn - chương trình sẽ chuyển đổi chúng sang MP3 một cách nhanh chóng. Nhân tiện, nhờ lõi đa luồng, chương trình có thể tạo sách nói rất nhanh chóng: một số mô-đun tổng hợp giọng nói (SAPI) có thể đồng thời "nói" cả một cuốn sách.

Cuối cùng nhưng không kém phần quan trọng, ICE Book Reader cho phép bạn dọn dẹp ổ cứng bằng sách: một cách để quản lý thông tin của 250.000 cuốn sách! Chương trình hoạt động trên tất cả các phiên bản phổ biến của Windows: XP, 7, 8, 10.

Người nói chuyện

Trang web của nhà phát triển: //govorunplus.narod.ru/

Chương trình đơn giản và đáng tin cậy dựa trên công nghệ MS Agent 2.0. Để tổng hợp giọng nói, nó có thể sử dụng bất kỳ công cụ SAPI nào có trong hệ thống của bạn. Chương trình không tỏa sáng với thiết kế, nhưng nó được thực hiện khá nguyên bản (màn hình bên dưới). Và chương trình khá đa chức năng (vì vậy đây là trường hợp quá sớm để đưa ra kết luận ngay từ cái nhìn đầu tiên!).

Talker - đọc văn bản

Các tính năng của chương trình:

  1. đọc và lưu các định dạng tệp: TXT, RTF (có thể được chuẩn bị trong bất kỳ phiên bản Word nào);
  2. khả năng làm việc với dòng lệnh;
  3. khả năng tích hợp vào trình thám hiểm để đọc văn bản bằng cách nhấp chuột phải vào tệp (chỉ hỗ trợ Win 98 / ME, NT, 2000, XP);
  4. có một trình phát các tệp phương tiện được tích hợp sẵn;
  5. những giai thoại, cách ngôn, hài hước, v.v. được tích hợp sẵn trong chương trình - sẽ không bao giờ khiến bạn cảm thấy nhàm chán;
  6. bài phát biểu được sao chép có thể được ghi lại thành tệp WAV;
  7. chương trình có thể được tùy chỉnh bởi chính bạn: màu sắc, thiết kế, phông chữ, v.v.;
  8. bằng tiếng Nga, hoạt động trong Windows XP, 7, 8, 10.

RussAcc

Trang web của nhà phát triển: //bzsoft.spb.ru/russacc.html

Nơi tải xuống: //www.softportal.com/software-18755-russacc.html

Một chương trình rất nhanh và thuận tiện để đọc to văn bản và tạo sách nói (có nhiều định dạng, đặc biệt là so với các phần mềm tương tự: wav, mp3, amr, aac). Ngoài ra, chương trình cho phép bạn đặt trọng âm một cách chính xác trong các văn bản và đọc sách từ màn hình PC. Chương trình có một trình soạn thảo tích hợp sẵn và bất kỳ văn bản nào được tái tạo bởi nó - bạn có thể chỉnh sửa.

Cửa sổ chính của chương trình // RussAcc

Trong cài đặt chương trình, bạn có thể đặt cỡ chữ, chỉ định màu để tô sáng phần có thể đọc được. Bạn có thể chỉ định và cấu hình các thông số để ghi MP3: tốc độ bit, số bit, v.v.

RussAcc hỗ trợ và hoạt động với tất cả các động cơ âm thanh phổ biến. Trong cơ sở dữ liệu riêng của mình, chương trình cho mỗi từ có các dạng đặc biệt với trọng âm trong các tình huống khác nhau (hơn 3 triệu dạng!).

Nhân tiện, RussAcc hỗ trợ một định dạng sách điện tử phổ biến như fb2 (và cũng có thể chuyển đổi nó thành một tệp txt thông thường). Hỗ trợ tiếng Nga, tương thích với hệ điều hành mới Windows 7, 8.1, 10.

*

Công cụ giọng nói: nam và nữ

Công cụ chuyển văn bản thành giọng nói - đây là phần mềm đặc biệt, một loại trình điều khiển, cần thiết để máy tính "nói" (tức là chuyển văn bản thành giọng nói). Có hàng trăm công cụ trên mạng hiện nay: có cả trả phí và miễn phí. Tất nhiên, chất lượng đọc tốt nhất được hiển thị bởi các công cụ trả phí.

Lưu ý quan trọng: công cụ chuyển văn bản thành giọng nói không có bất kỳ thiết kế hoặc giao diện nào. Sau khi cài đặt nó vào hệ thống, bạn sẽ không nhận thấy bất kỳ thay đổi nào cả! Để làm việc với engine, bạn cần một số loại chương trình để đọc văn bản: Balabolka, Talker, Ice Reader, v.v., ở trên tôi đã đưa ra những chương trình "Tôi thích" ✌).

Đó là lý do tại sao, bằng cách này, người dùng thường chỉ trích chương trình này hoặc chương trình kia rằng nó không thể đọc văn bản tiếng Nga (hoặc hoàn toàn không thể). Họ chỉ quên về sự cần thiết phải cài đặt một công cụ phát biểu.

Vài lời về tiêu chuẩn ...

Công cụ giọng nói có thể được triển khai theo các tiêu chuẩn khác nhau (được gọi là), ba tiêu chuẩn cơ bản nhất: SAPI 4, SAPI 5 hoặc Microsoft Speech Platform (lưu ý: trong hầu hết mọi chương trình đọc, bạn có thể chọn một công cụ giọng nói).

SAPI 4

Một tiêu chuẩn vững chắc, nó có liên quan cách đây hàng chục năm. Ngày nay nó đã lỗi thời, và việc sử dụng nó là không hợp lý trên các máy tính / máy tính xách tay hiện đại.

SAPI 5

Hầu hết tất cả các công cụ thoại hiện đại đều được xây dựng trên tiêu chuẩn này (cả trả phí và miễn phí). Tiêu chuẩn phổ biến nhất, bạn có thể tìm thấy động cơ với giọng nam, nữ, trẻ em.

Nền tảng giọng nói của Microsoft

Nền tảng giọng nói của Microsoft là một bộ công cụ dành cho nhà phát triển phong phú cho phép bạn triển khai khả năng chuyển văn bản thành giọng nói.

nó là một bộ công cụ cho phép các nhà phát triển của các ứng dụng khác nhau triển khai khả năng chuyển đổi văn bản thành giọng nói trong đó.

Ghi chú! Để bộ tổng hợp giọng nói hoạt động, bạn phải:

Microsoft Speech Platform - Runtime - phía máy chủ của nền tảng cung cấp API cho các chương trình;

Nền tảng giọng nói của Microsoft - Ngôn ngữ thời gian chạy - ngôn ngữ để chạy phía máy chủ.

Thêm chi tiết về nó tại đây - //msdn.microsoft.com/en-us/library/hh361572.aspx

Nhiều công cụ giọng nói

Công cụ chuyển văn bản thành giọng nói Digalo // Nikolay

Trang mạng: //www.digalo.com/index.htm

Cơ chế giọng nói của Nga rất phổ biến (giọng nam!). Phù hợp với hầu hết các chương trình có thể đọc văn bản bằng giọng nói. Theo ý kiến ​​khiêm tốn của tôi, một trong những công cụ tổng hợp giọng nói công khai tốt nhất (bằng tiếng Nga). Ngoài tiếng Nga, nhân tiện, các công cụ cho một số ngôn ngữ khác có sẵn trên trang web của nhà phát triển. Điểm trừ: nó chỉ hoạt động trong hai tuần mà không cần đăng ký.

Acapela // Công cụ giọng nói (mô-đun) Alena

Trang mạng: //www.acapela-group.com/

Alyonka là một công cụ giọng nói phụ nữ Nga tương đối mới từ Acapela. Hoạt động theo tiêu chuẩn SAPI-5 với tần số 22 KHz. Một số người dùng cho rằng giọng của Alena đẹp hơn Nikolai.

Công cụ giọng nói (mô-đun) Katerina 2

Công ty phát triển: ScanSoft RealSpeak

Giọng nữ khá hay. Sau khi sửa đổi động cơ, nó được so sánh với "Nikolai". Cơ sở ngữ âm của động cơ đã được cập nhật đáng kể, thuật toán thiết lập trọng âm đã được thay đổi (có ảnh hưởng tích cực đến âm thanh), vấn đề về tốc độ phát âm đã được khắc phục.

RHVoice

Trang mạng: //tiflo.info/rhvoice/

RHVoice là một bộ tổng hợp giọng nói đa ngôn ngữ mã nguồn mở. Sử dụng được trên HĐH Windows và Linux. Bộ tổng hợp tương thích với SAPI5. Bộ tổng hợp được thiết kế bởi Olga Yakovleva.

Nhân tiện, động cơ dựa trên cơ sở lời nói được ghi lại bởi người nói. Giọng Nga "Elena" và "Irina" có sẵn để tải xuống trên trang web chính thức.

IVONA Tatyana / Maxim

Trang mạng: //www.ivona.com/us/about-us/voice-portfolio/

Động cơ giọng nói trẻ rất thú vị (có 2 trong số đó: giọng nam và giọng nữ). Nhiều người coi giọng hát của Tatyana là một trong những chất hay nhất (nếu không muốn nói là hay nhất!). Sử dụng liên kết trên, bạn có thể nghe thấy văn bản của bạn sẽ phát ra như thế nào, có thể nói, một danh mục đầu tư (theo ý kiến ​​của tôi, chúng nghe rất hay).

Liệu động cơ có được sử dụng nhiều nhất hay không - Tôi không biết, thời gian sẽ trả lời!

*

Nhân tiện, bạn có nghĩ rằng sẽ có một công cụ phát âm nào không thể phân biệt được với giọng nói của một người bình thường không? Hoặc có thể nó đã tồn tại, nhưng tôi chưa nghe nói về nó ... (bỏ tên!)

Vậy là xong, chúc bạn may mắn!

👋

Lần xuất bản đầu tiên: 26/02/2017

Sửa: 15/06/2020

$config[zx-auto] not found$config[zx-overlay] not found