Buku audio semakin populer dibandingkan eBuku tradisional. Mereka lebih nyaman karena Anda dapat mendengarkannya kapan saja dan di mana saja.

Anda dapat mengonversi PDF eBuku ke buku audio dengan skrip Python sederhana. Menggunakan beberapa perpustakaan sederhana, Anda dapat mengembangkan proyek yang akan membacakan PDF dan menyimpan buku audio sebagai file baru.

Menginstal Paket yang Diperlukan

Anda perlu menginstal PyPDF3, pyttsx3, dan tukang ledeng pdf paket untuk memulai. Anda dapat menginstal paket-paket ini menggunakan manajer paket pip. Pastikan Anda sudah menginstal pip di sistem Anda. Jalankan perintah berikut di command prompt untuk menginstal paket:

pip Install PyPDF3 pyttsx3 pdftukang ledeng
  • Anda dapat menggunakan PyPDF3 perpustakaan untuk membaca dan mengedit file PDF dengan Python.
  • Itu pyttsx3 perpustakaan menyediakan konversi text-to-speech.
  • tukang ledeng pdf adalah perpustakaan yang memungkinkan Anda mengekstrak teks dan tabel dari file PDF.

Kode yang digunakan dalam proyek ini tersedia di a Repositori GitHub dan gratis untuk Anda gunakan di bawah lisensi MIT.

instagram viewer

Mengonversi PDF ke Buku Audio Menggunakan Python

Setelah Anda menginstal paket-paket di atas, Anda siap untuk mengimpornya ke file python Anda:

impor PyPDF3
impor pyttsx3
impor tukang ledeng pdf

Anda perlu memberikan nama dan lokasi file PDF yang ingin Anda konversi. Demi kesederhanaan, Anda dapat menggunakan file PDF sampel apa pun. Salin ke direktori yang sama dengan skrip Anda dan simpan namanya dalam variabel; jika disebut Lorem.pdf, Misalnya:

berkas = 'Lorem.pdf'

Selanjutnya, buat objek file untuk file PDF dan objek pembaca PDF:

buku = buka (berkas, 'rb')
pdfReader = PyPDF3.PdfFileReader (buku)

Nanti, Anda akan mengulang semua halaman file PDF. Untuk menemukan jumlah total halaman, gunakan: numPages Properti:

halaman = pdfReader.numPages

Sekarang, Anda siap untuk mengekstrak teks dari file PDF:

teks akhir = ""

dengan pdftukang ledeng.open(mengajukan) sebagai pdf:
untuk saya dalam rentang (0, halaman):
halaman = pdf.halaman[i]
teks = halaman.extract_text()
teks akhir += teks

Gunakan for loop untuk mengulang semua halaman dan mengekstrak teks dari PDF. Anda dapat menggunakan paket pdfplumber untuk membuka file pdf dan ekstrak_teks metode untuk mengambil teks dari halaman.

Dengan teks lengkap yang disimpan dalam variabel, Anda dapat memprosesnya lebih lanjut, tergantung pada kebutuhan Anda. Jika Anda ingin mengubah teks menjadi audio dan menyimpannya menjadi file baru, gunakan kode berikut:

mesin = pyttsx3.init()
engine.save_to_file (teks akhir, 'lorem.mp3')
mesin.lariDanTunggu()

Ketika kamu jalankan kode Python ini, itu akan membuat file buku audio di direktorinya.

Jika Anda tidak ingin menyimpan buku audio dan, misalnya, ingin membaca file PDF, Anda dapat menggunakan kode berikut sebagai gantinya:

mesin = pyttsx3.init()
mesin.mengatakan(teks akhir)
mesin.lariDanTunggu()

Ketika Anda menjalankan skrip ini, itu akan membaca file PDF.

Kembangkan Proyek Menggunakan Python

Python dikenal karena keserbagunaannya. Anda dapat dengan mudah membuat proyek dengan aplikasi praktis menggunakan Python.

Jika Anda ingin mengotori tangan Anda dengan kode Python, Anda bisa mulai dengan mengembangkan proyek mini. Beberapa ide awal yang bagus adalah aplikasi kuis, chatbot, permainan ular, penyingkat URL, pengikis web, atau pengonversi unit.