Rentang dinamis dikompresi atau standar. Sintesis dan pengenalan ucapan. Solusi modern. Peralatan suara komputer. Mengubah suara menjadi aliran angka. Masalah yang dipecahkan oleh kompresi

02.08.2020 Pemulihan data

Kompresi dinamis(Kompresi rentang dinamis, DRC) - mempersempit (atau memperluas dalam kasus expander) rentang dinamis fonogram. Rentang Dinamis, adalah perbedaan antara suara paling pelan dan paling keras. Kadang-kadang suara paling tenang dalam rekaman suara akan sedikit lebih keras daripada tingkat kebisingan, dan kadang-kadang sedikit lebih pelan daripada yang paling keras. Perangkat keras dan program yang melakukan kompresi dinamis disebut kompresor, membedakan empat kelompok utama di antaranya: kompresor itu sendiri, pembatas, ekspander, dan gerbang.

Kompresor tabung analog DBX 566

Kompresi ke bawah dan ke atas

kompresi bawah(Kompresi ke bawah) mengurangi volume suara saat melebihi ambang batas tertentu, sehingga suara yang lebih tenang tidak berubah. Versi ekstrim dari downcompression adalah pembatas. Kompresi Naik(Kompresi ke atas), sebaliknya, meningkatkan volume suara jika berada di bawah nilai ambang batas, tanpa mempengaruhi suara yang lebih keras. Pada saat yang sama, kedua jenis kompresi mempersempit rentang dinamis sinyal audio.

kompresi bawah

Kompresi Naik

Ekspander dan Gerbang

Jika kompresor mengurangi rentang dinamis, expander meningkatkannya. Ketika level sinyal berada di atas level ambang batas, expander meningkatkannya bahkan lebih, sehingga meningkatkan perbedaan antara suara keras dan lembut. Perangkat semacam itu sering digunakan saat merekam satu set drum untuk memisahkan suara satu drum dari drum lainnya.

Sebuah jenis expander yang digunakan tidak untuk memperkuat keras, tetapi untuk meredam suara tenang, tidak melebihi tingkat ambang (misalnya, kebisingan latar belakang) disebut gerbang kebisingan. Di perangkat seperti itu, segera setelah tingkat suara menjadi kurang dari ambang batas, sinyal berhenti lewat. Biasanya, gerbang digunakan untuk menekan kebisingan di jeda. Pada beberapa model, Anda dapat memastikan bahwa suara tidak berhenti tiba-tiba saat tingkat ambang tercapai, tetapi secara bertahap memudar. Dalam hal ini, tingkat peluruhan diatur oleh kontrol Peluruhan.

Gerbang, seperti jenis kompresor lainnya, dapat tergantung frekuensi(yaitu memperlakukan pita frekuensi tertentu secara berbeda) dan dapat beroperasi di rantai samping(Lihat di bawah).

Prinsip pengoperasian kompresor

Sinyal yang memasuki kompresor dibagi menjadi dua salinan. Satu salinan dikirim ke penguat di mana penguatan dikendalikan oleh sinyal eksternal, salinan kedua membentuk sinyal ini. Ini memasuki perangkat yang disebut rantai samping, di mana sinyal diukur, dan berdasarkan data ini, sebuah amplop dibuat yang menggambarkan perubahan volumenya.
Ini adalah bagaimana kebanyakan kompresor modern diatur, inilah yang disebut tipe feed-forward. Pada perangkat yang lebih tua (tipe umpan balik), level sinyal diukur setelah amplifier.

Ada berbagai teknologi analog untuk amplifikasi terkontrol (penguatan variabel), masing-masing dengan kelebihan dan kekurangannya sendiri: tabung, optik menggunakan fotoresistor dan transistor. Saat bekerja dengan suara digital(dalam editor suara atau DAW) dapat menggunakan algoritme matematikanya sendiri atau meniru pengoperasian teknologi analog.

Parameter utama kompresor

Ambang

Kompresor mengurangi level sinyal audio jika amplitudonya melebihi nilai ambang batas (threshold) tertentu. Biasanya ditentukan dalam desibel, dengan ambang batas yang lebih rendah (misalnya -60 dB) yang berarti lebih banyak suara yang akan diproses daripada ambang batas yang lebih tinggi (misalnya -5 dB).

Perbandingan

Besarnya penurunan level ditentukan oleh parameter rasio: rasio 4:1 artinya jika level input 4 dB di atas ambang batas, tingkat output akan menjadi 1 dB di atas ambang batas.
Sebagai contoh:
Ambang = -10dB
Sinyal input = -6 dB (4 dB di atas ambang batas)
Sinyal keluaran = -9 dB (1 dB di atas ambang batas)

Penting untuk diingat bahwa penekanan level sinyal berlanjut selama beberapa waktu setelah turun di bawah level ambang batas, dan waktu ini ditentukan oleh nilai parameter melepaskan.

Kompresi dengan rasio maksimum :1 disebut limiting. Ini berarti bahwa setiap sinyal di atas tingkat ambang batas dilemahkan ke tingkat ambang batas (kecuali untuk waktu yang singkat setelah peningkatan volume input yang tiba-tiba). Lihat "Pembatas" di bawah untuk detailnya.

Contoh nilai Rasio yang berbeda

Serang dan Lepaskan

Kompresor memberikan beberapa kendali atas seberapa cepat ia merespons perubahan dinamika sinyal. Parameter Attack menentukan waktu yang dibutuhkan kompresor untuk mengurangi gain ke level yang ditentukan oleh parameter Ratio. Rilis menentukan jumlah waktu yang diperlukan kompresor untuk meningkatkan penguatan, atau kembali normal jika level input turun di bawah ambang batas.

Fase Serangan dan Rilis

Parameter ini menunjukkan waktu (biasanya dalam milidetik) yang diperlukan agar penguatan berubah dengan sejumlah desibel tertentu, biasanya 10 dB. Misalnya, dalam kasus ini, jika Attack diatur ke 1ms, dibutuhkan 1ms untuk mengurangi gain sebesar 10dB, dan 2ms sebesar 20dB.

Di banyak kompresor, parameter Serangan dan Rilis dapat disesuaikan, tetapi di beberapa kompresor sudah diatur sebelumnya dan tidak dapat disesuaikan. Kadang-kadang mereka disebut sebagai "otomatis" atau "tergantung program", mis. berubah tergantung pada sinyal input.

Lutut

Pilihan kompresor lain: lutut keras/lunak. Ini menentukan apakah awal penerapan kompresi akan tiba-tiba (keras) atau bertahap (lunak). Lutut lunak mengurangi visibilitas transisi sinyal kering-ke-terkompresi, terutama pada Rasio tinggi dan peningkatan volume mendadak.

Kompresi Lutut Keras dan Lutut Lembut

Puncak dan RMS

Kompresor dapat merespons nilai puncak (maksimum jangka pendek) atau tingkat rata-rata sinyal input. Penggunaan nilai puncak dapat menyebabkan fluktuasi besar dalam tingkat kompresi, dan bahkan distorsi. Oleh karena itu, kompresor menerapkan fungsi rata-rata (biasanya RMS) dari sinyal input ketika membandingkannya dengan nilai ambang batas. Ini memberikan kompresi yang lebih nyaman yang mendekati persepsi manusia tentang kenyaringan.

RMS adalah parameter yang mencerminkan kenyaringan rata-rata fonogram. Dari sudut pandang matematis, RMS (Root Mean Square) adalah nilai akar rata-rata kuadrat dari amplitudo sejumlah sampel:

tautan stereo

Kompresor dalam mode tautan stereo menerapkan penguatan yang sama ke kedua saluran stereo. Ini menghindari pergeseran pan stereo yang dapat dihasilkan dari pemrosesan saluran kiri dan kanan satu per satu. Offset seperti itu terjadi jika, misalnya, elemen keras apa pun digeser ke luar pusat.

keuntungan riasan

Karena kompresor mengurangi level sinyal secara keseluruhan, biasanya menambahkan opsi penguatan tetap ke output untuk mendapatkan level optimal.

Lihat kedepan

Fungsi lihat ke depan dimaksudkan untuk menyelesaikan masalah yang terkait dengan nilai Serangan dan Rilis yang terlalu besar dan terlalu kecil. Waktu serangan yang terlalu lama tidak memungkinkan intersepsi transien yang efektif, dan waktu serangan yang terlalu pendek mungkin tidak nyaman bagi pendengar. Saat menggunakan fungsi lihat ke depan, sinyal utama tertunda relatif terhadap sinyal kontrol, ini memungkinkan kompresi dimulai terlebih dahulu, bahkan sebelum sinyal mencapai nilai ambang batas.
Satu-satunya kelemahan dari metode ini adalah waktu tunda sinyal, yang dalam beberapa kasus tidak diinginkan.

Menggunakan Kompresi Dinamis

Kompresi digunakan di mana-mana, tidak hanya dalam fonogram musik, tetapi juga di mana pun diperlukan untuk meningkatkan volume keseluruhan tanpa meningkatkan level puncak, di mana peralatan reproduksi suara yang murah atau saluran transmisi terbatas digunakan (alamat publik dan sistem komunikasi, radio amatir, dll. .) .

Kompresi diterapkan saat memutar musik latar (di toko, restoran, dll.) di mana perubahan volume yang mencolok tidak diinginkan.

Tetapi aplikasi paling penting dari kompresi dinamis adalah produksi dan penyiaran musik. Kompresi digunakan untuk memberikan suara "ketebalan" dan "penggerak", untuk kombinasi terbaik instrumen satu sama lain, dan terutama saat memproses vokal.

Vokal dalam musik rock dan pop biasanya dipadatkan agar menonjol dari iringan dan menambah kejelasan. Jenis kompresor khusus, yang hanya disetel ke frekuensi tertentu - de-esser, digunakan untuk menekan fonem yang mendesis.

Di bagian instrumental, kompresi juga digunakan untuk efek yang tidak berhubungan langsung dengan volume, misalnya, suara drum yang cepat memudar bisa menjadi lebih lama.

Musik dansa elektronik (EDM) sering menggunakan side-chaining (lihat di bawah) - misalnya, garis bass dapat digerakkan dengan tendangan atau serupa untuk mencegah konflik bass/drum dan menciptakan denyut dinamis.

Kompresi banyak digunakan dalam siaran (radio, TV, internet) untuk meningkatkan kenyaringan yang dirasakan sambil mengurangi rentang dinamis audio asli (biasanya CD). Sebagian besar negara memiliki batasan hukum pada volume maksimum instan yang dapat disiarkan. Biasanya batasan ini diterapkan oleh kompresor perangkat keras permanen di sirkuit on-air. Selain itu, meningkatkan kenyaringan yang dirasakan meningkatkan "kualitas" suara dari sudut pandang sebagian besar pendengar.

Lihat juga Perang keras.

Peningkatan berurutan dalam volume lagu yang sama, di-remaster untuk CD dari tahun 1983 hingga 2000.

rantai samping

Sakelar kompresor umum lainnya adalah "rantai samping". Dalam mode ini, suara dikompresi tidak tergantung pada levelnya sendiri, tetapi tergantung pada level sinyal yang datang ke konektor, yang biasa disebut side chain.

Ada beberapa kegunaan untuk ini. Misalnya, vokalisnya lisping dan semua huruf "s" menonjol dari keseluruhan gambar. Anda melewatkan suaranya melalui kompresor, dan suara yang sama dimasukkan ke jack rantai samping, tetapi melewati equalizer. Pada equalizer, Anda menghapus semua frekuensi kecuali yang digunakan oleh vokalis saat mengucapkan huruf "c". Biasanya sekitar 5 kHz, tetapi bisa dari 3 kHz hingga 8 kHz. Jika Anda kemudian menempatkan kompresor dalam mode rantai samping, maka kompresi suara akan terjadi pada saat-saat ketika huruf "s" diucapkan. Dengan demikian, perangkat yang dikenal sebagai "de-esser" (de-esser) diperoleh. Cara kerja ini disebut tergantung frekuensi.

Aplikasi lain dari fungsi ini disebut "ducker". Misalnya, di stasiun radio, musik melewati kompresor, dan kata-kata DJ melewati rantai samping. Saat DJ mulai mengobrol, volume musik akan berkurang secara otomatis. Efek ini juga dapat berhasil diterapkan dalam perekaman, misalnya, untuk mengurangi volume bagian keyboard saat bernyanyi.

pembatas dinding bata

Kompresor dan limiter bekerja dengan cara yang hampir sama, kita dapat mengatakan bahwa limiter adalah kompresor dengan Rasio tinggi (dari 10:1) dan biasanya waktu serangan rendah.

Ada konsep Brick wall limiting - limiting dengan Rasio yang sangat tinggi (dari 20:1 ke atas) dan serangan yang sangat cepat. Idealnya, itu tidak memungkinkan sinyal melebihi level ambang sama sekali. Hasilnya akan tidak enak di telinga, tetapi akan mencegah kerusakan pada peralatan penghasil suara atau melebihi lebar pita saluran. Banyak produsen mengintegrasikan pembatas ke dalam perangkat mereka untuk tujuan ini.

Clipper vs. Pembatas, kliping lembut dan keras

Kelompok metode ini didasarkan pada fakta bahwa sinyal yang ditransmisikan mengalami transformasi amplitudo nonlinier, dan di bagian transmisi dan penerima dari nonlinier saling terbalik. Misalnya, jika pemancar menggunakan fungsi non-linear u , penerima menggunakan u2 . Penerapan fungsi timbal balik yang berurutan akan mengarah pada fakta bahwa transformasi keseluruhan tetap linier.

Gagasan metode kompresi data non-linear adalah bahwa pemancar dapat, dengan amplitudo sinyal keluaran yang sama, mengirimkan rentang perubahan yang lebih besar pada parameter yang ditransmisikan (yaitu, rentang dinamis yang lebih besar). Rentang Dinamis adalah rasio amplitudo sinyal terbesar yang diizinkan ke yang terkecil, dinyatakan dalam satuan relatif atau desibel:

;	(2.17)
.	(2.18)

Keinginan alami untuk meningkatkan jangkauan dinamis dengan mengurangi U min dibatasi oleh sensitivitas peralatan dan peningkatan pengaruh interferensi dan kebisingan intrinsik.

Paling sering, kompresi rentang dinamis dilakukan menggunakan sepasang logaritma timbal balik dan fungsi potensiasi. Operasi pertama untuk mengubah amplitudo disebut kompresi(kompresi), yang kedua - ekspansi(menggeliat). Pilihan fungsi-fungsi ini terkait dengan kemungkinan kompresi terbesarnya.

Pada saat yang sama, metode ini juga memiliki kelemahan. Yang pertama adalah bahwa logaritma dari sejumlah kecil adalah negatif dan dalam batas:

yaitu, sensitivitasnya sangat non-linear.

Untuk mengurangi kekurangan ini, kedua fungsi dimodifikasi dengan bias dan aproksimasi. Misalnya, untuk saluran telepon, fungsi perkiraan memiliki bentuk (tipe A,):

dimana A=87.6. Keuntungan dari kompresi dalam hal ini adalah 24dB.

Kompresi data dengan prosedur non-linier diimplementasikan dengan cara analog dengan kesalahan besar. Penggunaan alat digital dapat secara signifikan meningkatkan akurasi atau kecepatan konversi. Dalam hal ini, penggunaan langsung teknologi komputer (yaitu perhitungan langsung logaritma dan eksponensial) tidak akan memberikan hasil terbaik karena kecepatan rendah dan akumulasi kesalahan perhitungan.

Kompresi data dengan kompresi karena keterbatasan akurasi digunakan dalam kasus-kasus non-kritis, misalnya, untuk transmisi suara melalui saluran telepon dan radio.

Pengkodean yang efisien

Kode yang efisien diusulkan oleh K. Shannon, Fano dan Huffman. Inti dari kode terletak pada kenyataan bahwa mereka tidak rata, yaitu dengan jumlah digit yang tidak sama, dan panjang kode berbanding terbalik dengan probabilitas kemunculannya. Fitur hebat lainnya dari kode efisien adalah mereka tidak memerlukan pembatas, mis. karakter spesial memisahkan kombinasi kode tetangga. Ini dicapai dengan mematuhi aturan sederhana: kode yang lebih pendek bukanlah awal dari kode yang lebih panjang. Dalam hal ini, aliran bit kontinu didekodekan dengan jelas karena dekoder mendeteksi pola yang lebih pendek terlebih dahulu. Kode yang efisien telah lama murni akademis, tetapi baru-baru ini berhasil digunakan dalam pembentukan basis data, serta dalam kompresi informasi di modem modern dan pengarsip perangkat lunak.

Karena ketidakrataan, panjang kode rata-rata diperkenalkan. Panjang rata-rata - ekspektasi matematis dari panjang kode:

apalagi, l cf cenderung ke H(x) dari atas (yaitu, l cf > H(x)).

Pemenuhan kondisi (2.23) menjadi lebih kuat dengan meningkatnya N.

Ada dua jenis kode efisien: Shannon-Fano dan Huffman. Mari kita ambil contoh untuk mendapatkannya. Misalkan probabilitas karakter dalam urutan memiliki nilai yang diberikan pada Tabel 2.1.

Tabel 2.1.

Probabilitas simbol

N
pi	0.1	0.2	0.1	0.3	0.05	0.15	0.03	0.02	0.05

Simbol diberi peringkat, yaitu, mereka disajikan dalam urutan probabilitas yang menurun. Setelah itu, menurut metode Shannon-Fano, prosedur berikut ini diulang secara berkala: seluruh kelompok kejadian dibagi menjadi dua subkelompok dengan probabilitas total yang sama (atau kurang lebih sama). Prosedur berlanjut sampai satu elemen tetap berada di subkelompok berikutnya, setelah elemen ini dihilangkan, dan tindakan yang ditentukan dilanjutkan dengan yang tersisa. Ini berlanjut sampai hanya ada satu elemen yang tersisa di dua subkelompok terakhir. Mari kita lanjutkan pertimbangan contoh kita, yang diringkas dalam Tabel 2.2.

Tabel 2.2.

Pengkodean Shannon-Fano

N	Pi
4	0.3		Saya
	0.2	Saya	II
6	0.15		Saya	Saya
	0.1			II
1	0.1			Saya	Saya
9	0.05	II			II
5	0.05		II		Saya
7	0.03			II	II	Saya
8	0.02					II

Seperti yang dapat dilihat dari Tabel 2.2, simbol pertama dengan probabilitas p 4 = 0,3 berpartisipasi dalam dua prosedur untuk membagi menjadi kelompok dan kedua kali jatuh ke dalam kelompok dengan nomor I . Dengan demikian, itu dikodekan dengan kode dua digit II. Elemen kedua pada tahap pertama partisi milik grup I, pada yang kedua - ke grup II. Oleh karena itu, kodenya adalah 10. Kode karakter yang tersisa tidak memerlukan komentar tambahan.

Biasanya kode yang tidak seragam digambarkan sebagai pohon kode. Pohon kode adalah grafik yang menunjukkan kombinasi kode yang diizinkan. Arah dari tepi grafik ini telah ditentukan sebelumnya, seperti yang ditunjukkan pada Gambar 2.11 (pilihan arah adalah sewenang-wenang).

Menurut grafik, mereka dipandu sebagai berikut: membuat rute untuk simbol yang dipilih; jumlah bit untuk itu sama dengan jumlah tepi dalam rute, dan nilai setiap bit sama dengan arah tepi yang sesuai. Rute diambil dari titik awal (dalam gambar itu ditandai dengan huruf A). Misalnya, rute ke simpul 5 terdiri dari lima sisi, yang semuanya kecuali yang terakhir memiliki arah 0; kita mendapatkan kode 00001.

Untuk contoh ini, kami menghitung entropi dan panjang rata-rata sebuah kata.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 bit

lav = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Seperti yang Anda lihat, panjang kata rata-rata mendekati entropi.

Kode Huffman dibangun sesuai dengan algoritma yang berbeda. Prosedur encoding terdiri dari dua langkah. Pada tahap pertama, kompresi alfabet satu kali dilakukan secara berurutan. Kompresi satu kali - mengganti dua karakter terakhir (dengan probabilitas terendah) dengan satu, dengan probabilitas total. Kompresi dilakukan hingga tersisa dua karakter. Pada saat yang sama, tabel pengkodean diisi, di mana probabilitas yang dihasilkan diletakkan, dan rute yang dilalui simbol baru pada tahap berikutnya juga digambarkan.

Pada tahap kedua, pengkodean yang sebenarnya terjadi, yang dimulai dari tahap terakhir: yang pertama dari dua karakter diberi kode 1, yang kedua - 0. Setelah itu, mereka pergi ke tahap sebelumnya. Kode dari tahap berikutnya ditugaskan ke karakter yang tidak berpartisipasi dalam kompresi pada tahap ini, dan kode karakter yang diperoleh setelah menempelkan dua kali ditugaskan ke dua karakter terakhir dan ditambahkan ke kode karakter atas 1, yang lebih rendah satu - 0. Jika karakter tidak lebih lanjut dalam perekatan berpartisipasi, kodenya tetap tidak berubah. Prosedur berlanjut sampai akhir (yaitu, sampai tahap pertama).

Tabel 2.3 menunjukkan pengkodean Huffman. Seperti dapat dilihat dari tabel, pengkodean dilakukan dalam 7 tahap. Di sebelah kiri adalah probabilitas simbol, di sebelah kanan - kode perantara. Panah menunjukkan gerakan simbol yang baru terbentuk. Pada setiap tahap, dua karakter terakhir hanya berbeda dalam bit yang paling tidak signifikan, yang sesuai dengan teknik pengkodean. Hitung rata-rata panjang kata:

lav = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Ini bahkan lebih mendekati entropi: kodenya bahkan lebih efisien. pada gambar. 2.12 menunjukkan pohon kode Huffman.

Tabel 2.3.

Pengkodean Huffman

N	pi	Kode	Saya	II	AKU AKU AKU	IV	V	VI	VII
	0.3		0.3 11	0.3 11	0.3 11	0.3 11	0.3 11	0.4 0	0.6 1
	0.2		0.2 01	0.2 01	0.2 01	0.2 01	0.3 10	0.3 11	0.4 0
	0.15		0.15 101	0.15 101	0.15 101	0.2 00	0.2 01	0.3 10
	0.1		0.1 001	0.1 001	0.15 100	0.15 101	0.2 00
	0.1		0.1 000	0.1 000	0.1 001	0.15 100
	0.05		0.05 1000	0.1 1001	0.1 000
	0.05		0.05 10011	0.05 1000
	0.03		0.05 10010
	0.02

Kedua kode memenuhi persyaratan decoding yang tidak ambigu: seperti dapat dilihat dari tabel, kombinasi yang lebih pendek bukanlah awal dari kode yang lebih panjang.

Dengan peningkatan jumlah karakter, efisiensi kode meningkat, oleh karena itu, dalam beberapa kasus, blok yang lebih besar dikodekan (misalnya, ketika datang ke teks, Anda dapat menyandikan beberapa suku kata, kata, dan bahkan frasa yang paling umum. ).

Pengaruh pengenalan kode tersebut ditentukan dengan membandingkannya dengan kode seragam:

(2.24)

di mana n adalah jumlah digit kode seragam, yang diganti dengan yang efektif.

Modifikasi kode Huffman

Algoritma Huffman klasik mengacu pada dua-pass, yaitu. pertama membutuhkan satu set statistik pada simbol dan pesan, dan kemudian prosedur yang dijelaskan di atas. Ini tidak nyaman dalam praktiknya, karena meningkatkan waktu untuk pemrosesan pesan dan akumulasi kamus. Metode one-pass lebih umum digunakan, di mana prosedur akumulasi dan encoding digabungkan. Metode tersebut juga disebut kompresi adaptif Huffman [46].

Inti dari kompresi adaptif menurut Huffman direduksi menjadi konstruksi pohon kode awal dan modifikasi selanjutnya setelah kedatangan setiap karakter berikutnya. Seperti sebelumnya, pohon-pohon di sini adalah biner, yaitu. dari setiap simpul dari pohon-graf datang maksimal dua busur. Merupakan kebiasaan untuk memanggil simpul awal orang tua, dan dua simpul berikutnya yang terkait dengannya - anak-anak. Mari kita perkenalkan konsep bobot simpul - ini adalah jumlah karakter (kata) yang sesuai dengan simpul yang diberikan, diperoleh saat mengirimkan urutan aslinya. Jelas, jumlah berat anak-anak sama dengan berat orang tua.

Setelah pengenalan simbol berikutnya dari urutan input, pohon kode direvisi: bobot simpul dihitung ulang dan, jika perlu, simpul diatur ulang. Aturan permutasi simpul adalah sebagai berikut: bobot simpul bawah adalah yang terkecil, dan simpul di sebelah kiri grafik memiliki bobot terkecil.

Pada saat yang sama, simpul diberi nomor. Penomoran dimulai dari simpul bawah (menggantung, yaitu tanpa anak) dari kiri ke kanan, kemudian dipindahkan ke tingkat atas dll. hingga penomoran simpul awal terakhir. Dalam hal ini, hasil berikut dicapai: semakin kecil bobot simpul, semakin kecil jumlahnya.

Permutasi dilakukan terutama untuk simpul gantung. Saat menyusun ulang, aturan yang dirumuskan di atas harus diperhitungkan: simpul dengan bobot besar juga memiliki jumlah yang lebih besar.

Setelah melewati urutan (juga disebut kontrol atau tes), kombinasi kode ditugaskan ke semua simpul gantung. Aturan penetapan kode mirip dengan yang di atas: jumlah bit kode sama dengan jumlah simpul yang dilalui rute dari sumber ke simpul gantung yang diberikan, dan nilai bit tertentu sesuai dengan arah dari induk ke "anak" (katakanlah, bergerak ke kiri dari induk sesuai dengan nilai 1, ke kanan - 0 ).

Kombinasi kode yang dihasilkan dimasukkan ke dalam memori perangkat kompresi bersama dengan rekan-rekan mereka dan membentuk kamus. Penggunaan algoritma tersebut adalah sebagai berikut. Urutan karakter yang dikompresi dibagi menjadi fragmen sesuai dengan kamus yang tersedia, setelah itu masing-masing fragmen diganti dengan kodenya dari kamus. Fragmen yang tidak ditemukan dalam kamus membentuk simpul gantung baru, bertambah berat dan juga dimasukkan ke dalam kamus. Dengan demikian, algoritma pengisian kamus adaptif terbentuk.

Untuk meningkatkan efisiensi metode, diinginkan untuk meningkatkan ukuran kamus; dalam hal ini, rasio kompresi meningkat. Dalam praktiknya, ukuran kamus adalah 4 - 16 KB memori.

Mari kita ilustrasikan algoritma di atas dengan sebuah contoh. pada gambar. 2.13 menunjukkan diagram asli (juga disebut pohon Huffman). Setiap simpul pohon ditunjukkan oleh persegi panjang di mana dua digit dimasukkan melalui pecahan: yang pertama menunjukkan jumlah simpul, yang kedua - beratnya. Seperti yang Anda lihat, korespondensi antara bobot simpul dan jumlahnya terpenuhi.

Mari kita asumsikan bahwa simbol yang sesuai dengan simpul 1 muncul untuk kedua kalinya dalam urutan pengujian. Bobot simpul telah berubah, seperti yang ditunjukkan pada Gambar. 2.14, akibatnya aturan penomoran simpul dilanggar. Pada tahap selanjutnya, kami mengubah lokasi simpul gantung, di mana kami menukar simpul 1 dan 4 dan memberi nomor ulang semua simpul pohon. Grafik yang dihasilkan ditunjukkan pada Gambar. 2.15. Prosedur kemudian berlanjut dengan cara yang sama.

Harus diingat bahwa setiap simpul gantung di pohon Huffman sesuai dengan karakter atau kelompok tertentu dari mereka. Orang tua berbeda dari anak-anak dalam kelompok karakter yang sesuai dengan itu adalah satu karakter lebih pendek dari anak-anaknya, dan anak-anak ini berbeda dalam karakter terakhir. Misalnya, induk cocok dengan karakter "kar"; maka anak-anak mungkin memiliki urutan "kara" dan "karp".

Algoritme di atas tidak bersifat akademis dan aktif digunakan dalam program pengarsipan, termasuk saat mengompresi data grafik (akan dibahas di bawah).

Algoritma Lempel–Ziva

Ini adalah algoritma kompresi yang paling umum digunakan saat ini. Mereka digunakan di sebagian besar program - pengarsip (misalnya, PKZIP, ARJ, LHA). Inti dari algoritme terletak pada kenyataan bahwa serangkaian karakter tertentu diganti selama pengarsipan dengan nomornya dalam kamus yang dibentuk khusus. Misalnya, sering ditemukan di korespondensi bisnis kalimat "Nomor keluar untuk surat Anda ..." dapat menempati posisi 121 dalam kamus; maka alih-alih mentransmisikan atau menyimpan frasa tersebut (30 byte), Anda dapat menyimpan nomor frasa (1,5 byte dalam BCD atau 1 byte dalam biner).

Algoritme dinamai menurut penulis yang pertama kali mengusulkannya pada tahun 1977. Dari jumlah tersebut, yang pertama adalah LZ77. Untuk pengarsipan, apa yang disebut jendela geser pesan dibuat, yang terdiri dari dua bagian. Bagian pertama, dengan format yang lebih besar, berfungsi untuk membentuk kamus dan memiliki ukuran orde beberapa kilobyte. Bagian kedua yang lebih kecil (biasanya hingga 100 byte) menerima karakter saat ini dari teks yang sedang dilihat. Algoritme mencoba menemukan sekumpulan karakter dalam kamus yang cocok dengan yang diterima di area pandang. Jika ini berhasil, kode yang terdiri dari tiga bagian akan terbentuk: offset dalam kamus relatif terhadap substring awal, panjang substring ini, dan karakter yang mengikuti substring ini. Misalnya, substring yang dipilih terdiri dari karakter "app" (total 6 karakter), karakter yang mengikutinya adalah "e". Kemudian, jika substring memiliki alamat (tempat di kamus) 45, maka entri dalam kamus terlihat seperti "45, 6. e". Setelah itu, isi jendela digeser oleh suatu posisi, dan pencarian berlanjut. Dengan demikian, kamus terbentuk.

Keuntungan dari algoritma ini adalah algoritma kompilasi kamus yang mudah diformalkan. Selain itu, membuka ritsleting dimungkinkan tanpa kamus awal (diinginkan untuk memiliki urutan pengujian pada saat yang sama) - kamus terbentuk selama membuka ritsleting.

Kerugian dari algoritma muncul ketika ukuran kamus meningkat - waktu pencarian meningkat. Selain itu, jika string karakter muncul di jendela saat ini yang tidak ada dalam kamus, setiap karakter ditulis dengan kode tiga elemen, mis. Ini bukan kompresi, tapi ekspansi.

Fitur terbaik memiliki algoritma LZSS yang diusulkan pada tahun 1978. Ini memiliki perbedaan dalam pemeliharaan jendela geser dan kode keluaran kompresor. Selain jendela, algoritme membentuk pohon biner yang mirip dengan pohon Huffman untuk mempercepat pencarian kecocokan: setiap substring yang meninggalkan jendela saat ini ditambahkan ke pohon sebagai salah satu anak. Algoritma ini memungkinkan Anda untuk menambah ukuran jendela saat ini (diinginkan bahwa nilainya sama dengan kekuatan dua: 128, 256, dll. byte). Kode urutan juga dibentuk secara berbeda: awalan 1-bit tambahan diperkenalkan untuk membedakan karakter yang tidak dikodekan dari pasangan "offset, panjang".

Tingkat kompresi yang lebih besar diperoleh saat menggunakan algoritme seperti LZW. Algoritme yang dijelaskan sebelumnya memiliki ukuran jendela tetap, yang membuatnya mustahil untuk memasukkan frasa yang lebih panjang dari ukuran jendela ke dalam kamus. Dalam algoritme LZW (dan pendahulunya LZ78), area pandang memiliki ukuran tidak terbatas, dan kamus mengumpulkan frasa (dan bukan kumpulan karakter, seperti sebelumnya). Kamus memiliki panjang yang tidak terbatas, dan encoder (decoder) bekerja dalam mode menunggu frase. Ketika frasa yang cocok dengan kamus terbentuk, kode kecocokan (yaitu kode untuk frasa itu dalam kamus) dan kode karakter yang mengikutinya dikembalikan. Jika, ketika karakter terakumulasi, frasa baru terbentuk, itu juga dimasukkan ke dalam kamus, serta yang lebih pendek. Hasilnya adalah prosedur rekursif yang menyediakan encoding dan decoding yang cepat.

Fitur tambahan kompresi menyediakan pengkodean terkompresi dari karakter berulang. Jika dalam urutan beberapa karakter mengikuti secara berurutan (misalnya, dalam teks ini bisa berupa karakter "spasi", dalam urutan numerik - nol berurutan, dll.), maka masuk akal untuk menggantinya dengan sepasang "karakter ; panjang" atau "tanda, panjang". Dalam kasus pertama, kode menunjukkan tanda bahwa urutan akan dikodekan (biasanya 1 bit), kemudian kode karakter yang diulang dan panjang urutan. Dalam kasus kedua (disediakan untuk karakter berulang yang paling sering muncul), awalan hanya menunjukkan tanda pengulangan.

Atau garis lintang fotografi bahan fotografi adalah rasio antara nilai eksposur maksimum dan minimum yang dapat ditangkap dengan benar dalam gambar. Seperti yang diterapkan pada fotografi digital, rentang dinamis sebenarnya setara dengan rasio nilai maksimum dan minimum yang mungkin dari sinyal listrik berguna yang dihasilkan oleh fotosensor selama eksposur.

Rentang dinamis diukur dalam langkah eksposur (). Setiap langkah sesuai dengan menggandakan jumlah cahaya. Jadi, misalnya, jika kamera tertentu memiliki rentang dinamis 8 EV, maka ini berarti bahwa nilai maksimum yang mungkin dari sinyal yang berguna dari matriksnya terkait dengan minimum 2 8: 1, yang berarti bahwa kamera mampu menangkap objek yang berbeda kecerahannya dalam satu frame tidak lebih dari 256 kali. Lebih tepatnya, ia dapat menangkap objek dengan kecerahan apa pun, namun, objek yang kecerahannya akan melebihi nilai maksimum yang diizinkan akan keluar putih menyilaukan dalam gambar, dan objek yang kecerahannya akan di bawah nilai minimum akan menjadi hitam pekat. Detail dan tekstur hanya dapat dibedakan pada objek tersebut, yang kecerahannya sesuai dengan rentang dinamis kamera.

Untuk menggambarkan hubungan antara kecerahan subjek yang paling terang dan paling gelap dari subjek yang difoto, istilah "rentang dinamis pemandangan" yang kurang tepat sering digunakan. Akan lebih tepat untuk berbicara tentang rentang kecerahan atau tingkat kontras, karena rentang dinamis biasanya merupakan karakteristik dari alat pengukur (dalam hal ini, matriks kamera digital).

Sayangnya, rentang kecerahan dari banyak pemandangan indah yang kita temui dalam kehidupan nyata dapat secara signifikan melebihi rentang dinamis kamera digital. Dalam kasus seperti itu, fotografer dipaksa untuk memutuskan objek mana yang harus dikerjakan dengan sangat detail, dan mana yang dapat dibiarkan di luar rentang dinamis tanpa mengorbankan niat kreatif. Untuk memaksimalkan jangkauan dinamis kamera Anda, terkadang Anda mungkin tidak perlu begitu banyak memahami prinsip pengoperasian sensor foto sebagai bakat artistik yang dikembangkan.

Faktor yang membatasi rentang dinamis

Batas bawah rentang dinamis diatur oleh tingkat kebisingan intrinsik dari fotosensor. Bahkan matriks yang tidak menyala menghasilkan sinyal listrik latar belakang yang disebut kebisingan gelap. Juga, gangguan terjadi ketika muatan ditransfer ke konverter analog-ke-digital, dan ADC sendiri memasukkan kesalahan tertentu ke dalam sinyal digital - yang disebut. pengambilan sampel kebisingan.

Jika Anda mengambil gambar dalam kegelapan total atau dengan tutup lensa, kamera hanya akan merekam noise yang tidak berarti ini. Jika jumlah minimum cahaya diperbolehkan untuk mengenai sensor, fotodioda akan mulai menumpuk muatan listrik. Besarnya muatan, dan karenanya intensitas sinyal yang berguna, akan sebanding dengan jumlah foton yang ditangkap. Agar detail yang berarti muncul dalam gambar, tingkat sinyal yang berguna harus melebihi tingkat kebisingan latar belakang.

Dengan demikian, batas bawah rentang dinamis atau, dengan kata lain, ambang sensitivitas sensor dapat didefinisikan secara formal sebagai tingkat sinyal keluaran di mana rasio signal-to-noise lebih besar dari satu.

Batas atas rentang dinamis ditentukan oleh kapasitansi fotodioda tunggal. Jika selama pemaparan, setiap fotodioda mengakumulasi muatan listrik dengan nilai maksimum untuk dirinya sendiri, maka piksel gambar yang sesuai dengan fotodioda yang kelebihan beban akan menjadi benar-benar putih, dan penyinaran lebih lanjut tidak akan memengaruhi kecerahannya dengan cara apa pun. Fenomena ini disebut kliping. Semakin tinggi kapasitas kelebihan dari fotodioda, semakin banyak sinyal yang dapat diberikannya pada output sebelum mencapai saturasi.

Untuk kejelasan yang lebih besar, mari kita beralih ke kurva karakteristik, yang merupakan grafik ketergantungan sinyal output pada eksposur. Sumbu horizontal adalah logaritma biner dari iradiasi yang diterima oleh sensor, dan sumbu vertikal adalah logaritma biner dari besarnya sinyal listrik yang dihasilkan oleh sensor dalam menanggapi iradiasi ini. Gambar saya sebagian besar sewenang-wenang dan hanya untuk tujuan ilustrasi. Kurva karakteristik dari fotosensor asli memiliki bentuk yang sedikit lebih kompleks, dan tingkat kebisingan jarang begitu tinggi.

Dua titik balik kritis terlihat jelas pada grafik: yang pertama, tingkat sinyal yang berguna melintasi ambang kebisingan, dan yang kedua, fotodioda mencapai saturasi. Nilai eksposur antara dua titik ini merupakan rentang dinamis. Dalam contoh abstrak ini, seperti yang dapat Anda lihat dengan mudah, sama dengan 5 EV, yaitu. kamera mampu mencerna lima penggandaan eksposur, yang setara dengan perbedaan kecerahan 32 kali lipat (2 5 = 32).

Zona eksposur yang membentuk rentang dinamis tidak setara. Zona atas memiliki rasio signal-to-noise yang lebih tinggi, dan karenanya terlihat lebih bersih dan lebih detail daripada yang lebih rendah. Akibatnya, batas atas rentang dinamis sangat nyata dan nyata - kliping memotong cahaya pada pencahayaan berlebih sekecil apa pun, sedangkan batas bawah tenggelam secara tidak mencolok dalam kebisingan, dan transisi ke hitam tidak setajam ke putih.

Ketergantungan linier sinyal pada eksposur, serta dataran tinggi yang tajam, adalah fitur unik dari proses fotografi digital. Sebagai perbandingan, lihat kurva karakteristik kondisional film fotografi tradisional.

Bentuk kurva dan terutama sudut kemiringan sangat bergantung pada jenis film dan prosedur pengembangannya, tetapi perbedaan utama yang mencolok antara grafik film dan grafik digital tetap tidak berubah - sifat non-linier dari grafik. ketergantungan kepadatan optik film pada nilai eksposur.

Batas bawah garis lintang fotografis dari film negatif ditentukan oleh kerapatan selubung, dan batas atas ditentukan oleh kerapatan optik maksimum yang dapat dicapai dari lapisan foto; untuk film reversibel, kebalikannya adalah benar. Baik dalam bayangan dan sorotan, kurva halus dari kurva karakteristik diamati, menunjukkan penurunan kontras ketika mendekati batas rentang dinamis, karena kemiringan kurva sebanding dengan kontras gambar. Dengan demikian, area eksposur yang terletak di tengah grafik memiliki kontras maksimum, sedangkan kontras berkurang dalam sorotan dan bayangan. Dalam praktiknya, perbedaan antara film dan matriks digital terutama terlihat dalam sorotan: di mana pada gambar digital, lampu padam dengan kliping, pada film detailnya masih dapat dibedakan, meskipun dengan kontras rendah, dan transisi ke warna putih bersih terlihat mulus dan natural.

Dalam sensitometri, bahkan dua istilah independen digunakan: sebenarnya garis lintang fotografi, dibatasi oleh bagian yang relatif linier dari kurva karakteristik, dan garis lintang fotografi yang berguna, yang, selain bagian linier, juga mencakup alas dan bahu grafik.

Patut dicatat bahwa ketika memproses foto digital, sebagai aturan, kurva berbentuk S yang kurang lebih menonjol diterapkan padanya, meningkatkan kontras dalam nada tengah dengan biaya mengurangi bayangan dan sorotan, yang memberikan gambar digital lebih natural dan enak dipandang mata.

Kedalaman bit

Berbeda dengan matriks kamera digital, penglihatan manusia dicirikan oleh, katakanlah, pandangan logaritmik dunia. Penggandaan jumlah cahaya secara berurutan dianggap oleh kita sebagai perubahan kecerahan yang sama. Angka cahaya bahkan dapat dibandingkan dengan oktaf musik, karena perubahan dua kali lipat dalam frekuensi suara dirasakan oleh telinga sebagai interval musik tunggal. Organ-organ indera lainnya bekerja dengan prinsip yang sama. Non-linearitas persepsi sangat memperluas jangkauan kepekaan manusia terhadap rangsangan dari berbagai intensitas.

Saat mengonversi file RAW (tidak masalah - menggunakan kamera atau dalam konverter RAW) yang berisi data linier, yang disebut. kurva gamma, yang dirancang untuk meningkatkan kecerahan secara non-linear gambar digital, membawanya sejalan dengan kekhasan penglihatan manusia.

Dengan konversi linier, gambar terlalu gelap.

Setelah koreksi gamma, kecerahan kembali normal.

Kurva gamma, seolah-olah, meregangkan nada gelap dan memampatkan nada terang, membuat distribusi gradasi lebih seragam. Hasilnya adalah gambar yang tampak alami, tetapi noise dan artefak pengambilan sampel dalam bayangan pasti menjadi lebih terlihat, yang hanya diperburuk oleh sedikitnya tingkat kecerahan di zona yang lebih rendah.

Distribusi linier gradasi kecerahan.

Distribusi seragam setelah menerapkan kurva gamma.

ISO dan rentang dinamis

Terlepas dari kenyataan bahwa fotografi digital menggunakan konsep fotosensitifitas bahan fotografi yang sama seperti dalam fotografi film, harus dipahami bahwa ini terjadi semata-mata karena tradisi, karena pendekatan untuk mengubah fotosensitifitas dalam fotografi digital dan fotografi film berbeda secara mendasar.

Meningkatkan kecepatan ISO dalam fotografi tradisional berarti mengubah dari satu film ke film lainnya dengan butiran yang lebih kasar, mis. ada perubahan objektif dalam sifat-sifat bahan fotografi itu sendiri. Dalam kamera digital, sensitivitas cahaya sensor diatur secara kaku oleh karakteristik fisiknya dan tidak dapat diubah secara harfiah. Saat meningkatkan ISO, kamera tidak mengubah sensitivitas sensor yang sebenarnya, tetapi hanya memperkuat sinyal listrik yang dihasilkan oleh sensor sebagai respons terhadap penyinaran dan menyesuaikan algoritme untuk mendigitalkan sinyal ini.

Konsekuensi penting dari hal ini adalah penurunan rentang dinamis efektif sebanding dengan peningkatan ISO, karena seiring dengan sinyal yang berguna, noise juga meningkat. Jika pada ISO 100 seluruh rentang nilai sinyal didigitalkan - dari nol hingga titik saturasi, maka pada ISO 200 hanya setengah dari kapasitas fotodioda yang diambil sebagai maksimum. Dengan setiap penggandaan sensitivitas ISO, pemberhentian teratas rentang dinamis tampaknya terpotong, dan langkah-langkah yang tersisa ditarik ke atas pada tempatnya. Itulah sebabnya penggunaan nilai ISO ultra-tinggi tidak memiliki arti praktis. Dengan keberhasilan yang sama, Anda dapat mencerahkan foto di konverter RAW dan mendapatkan tingkat kebisingan yang sebanding. Perbedaan antara meningkatkan ISO dan mencerahkan gambar secara artifisial adalah ketika ISO dinaikkan, sinyal diperkuat sebelum memasuki ADC, yang berarti bahwa derau kuantisasi tidak diperkuat, tidak seperti derau sensor itu sendiri, saat dalam konverter RAW mereka tunduk pada amplifikasi termasuk kesalahan ADC. Selain itu, mengurangi rentang pengambilan sampel berarti pengambilan sampel yang lebih akurat dari nilai sinyal input yang tersisa.

Omong-omong, menurunkan ISO di bawah nilai dasar (misalnya, ke ISO 50), yang tersedia di beberapa perangkat, tidak memperluas rentang dinamis sama sekali, tetapi hanya melemahkan sinyal hingga setengahnya, yang setara dengan menggelapkan gambar dalam konverter RAW. Fungsi ini bahkan dapat dianggap berbahaya, karena menggunakan nilai ISO sub-minimum memicu kamera untuk meningkatkan eksposur, yang, dengan ambang saturasi sensor tetap tidak berubah, meningkatkan risiko terpotongnya sorotan.

Nilai sebenarnya dari rentang dinamis

Ada sejumlah program seperti (DxO Analyzer, Imatest, RawDigger, dll.) yang memungkinkan Anda mengukur rentang dinamis kamera digital di rumah. Pada prinsipnya, ini tidak terlalu diperlukan, karena data untuk sebagian besar kamera dapat ditemukan secara bebas di Internet, misalnya, di DxOMark.com.

Haruskah kita memercayai hasil tes semacam itu? Lumayan. Dengan satu-satunya peringatan bahwa semua tes ini menentukan efektif atau, dengan kata lain, rentang dinamis teknis, yaitu. hubungan antara tingkat kejenuhan dan tingkat kebisingan matriks. Untuk fotografer, rentang dinamis yang berguna adalah yang paling penting, yaitu. jumlah zona eksposur yang benar-benar memungkinkan Anda untuk menangkap beberapa informasi yang berguna.

Seperti yang Anda ingat, ambang rentang dinamis diatur oleh tingkat kebisingan fotosensor. Masalahnya adalah, dalam praktiknya, zona bawah, yang secara teknis sudah termasuk dalam rentang dinamis, masih mengandung terlalu banyak noise untuk digunakan secara berguna. Di sini, banyak tergantung pada rasa jijik individu - setiap orang menentukan tingkat kebisingan yang dapat diterima untuk dirinya sendiri.

Pendapat subjektif saya adalah bahwa detail dalam bayangan mulai terlihat kurang lebih layak pada rasio signal-to-noise setidaknya delapan. Atas dasar itu, saya mendefinisikan rentang dinamis yang berguna untuk diri saya sendiri sebagai rentang dinamis teknis dikurangi sekitar tiga stop.

Misalnya, jika kamera refleks memiliki rentang dinamis 13 EV, yang sangat bagus menurut standar saat ini, menurut pengujian yang andal, maka rentang dinamis yang berguna adalah sekitar 10 EV, yang secara umum juga cukup baik. Tentu saja, kita berbicara tentang pemotretan dalam RAW, dengan ISO minimum dan kedalaman bit maksimum. Saat memotret dalam JPEG, rentang dinamis sangat bergantung pada pengaturan kontras, tetapi rata-rata, dua hingga tiga stop lainnya harus dibuang.

Sebagai perbandingan: film reversibel warna memiliki garis lintang fotografi yang berguna 5-6 langkah; film negatif hitam-putih memberikan 9-10 stop dengan pengembangan standar dan prosedur pencetakan, dan dengan manipulasi tertentu - hingga 16-18 stop.

Meringkas hal di atas, mari kita coba merumuskan beberapa aturan sederhana, berikut ini yang akan membantu Anda memaksimalkan sensor kamera Anda:

Rentang dinamis kamera digital sepenuhnya tersedia hanya saat memotret dalam RAW.
Rentang dinamis menurun saat ISO meningkat, jadi hindari ISO tinggi kecuali benar-benar diperlukan.
Menggunakan kedalaman bit yang lebih tinggi untuk file RAW tidak meningkatkan rentang dinamis yang sebenarnya, tetapi meningkatkan pemisahan nada dalam bayangan dengan mengorbankan lagi tingkat kecerahan.
Eksposur ke kanan. Zona eksposur atas selalu berisi maksimum informasi berguna dengan kebisingan minimum dan harus digunakan paling efisien. Pada saat yang sama, jangan lupa tentang bahaya kliping - piksel yang telah mencapai saturasi sama sekali tidak berguna.

Dan yang terpenting, jangan terlalu khawatir tentang jangkauan dinamis kamera Anda. Tidak apa-apa dengan rentang dinamis. Kemampuan Anda untuk melihat cahaya dan mengatur eksposur dengan benar jauh lebih penting. Seorang fotografer yang baik tidak akan mengeluh tentang kurangnya garis lintang fotografi, tetapi akan mencoba menunggu pencahayaan yang lebih nyaman, atau mengubah sudut, atau menggunakan lampu kilat, dengan kata lain, akan bertindak sesuai dengan keadaan. Saya akan memberi tahu Anda lebih banyak: beberapa adegan hanya mendapat manfaat dari fakta bahwa mereka tidak cocok dengan jangkauan dinamis kamera. Seringkali, banyak detail yang tidak perlu hanya perlu disembunyikan dalam siluet hitam semi-abstrak, yang membuat foto menjadi ringkas dan lebih kaya.

Kontras tinggi tidak selalu buruk - Anda hanya perlu bisa bekerja dengannya. Belajarlah untuk mengeksploitasi kelemahan peralatan serta kekuatannya, dan Anda akan terkejut melihat seberapa besar kreativitas Anda berkembang.

Terima kasih atas perhatian Anda!

Vasily A.

post scriptum

Jika artikel tersebut ternyata bermanfaat dan informatif bagi Anda, Anda dapat dengan ramah mendukung proyek ini dengan berkontribusi pada pengembangannya. Jika Anda tidak menyukai artikel tersebut, tetapi Anda memiliki pemikiran untuk membuatnya lebih baik, kritik Anda akan diterima dengan rasa terima kasih yang tidak sedikit.

Jangan lupa bahwa artikel ini tunduk pada hak cipta. Mencetak ulang dan mengutip diperbolehkan asalkan ada tautan yang valid ke sumber aslinya, dan teks yang digunakan tidak boleh terdistorsi atau dimodifikasi dengan cara apa pun.

Kompresi adalah salah satu topik paling mistis dalam produksi suara. Mereka mengatakan bahwa Beethoven bahkan menakuti anak-anak tetangganya :(

Oke, sebenarnya menerapkan kompresi tidak lebih sulit daripada menggunakan distorsi, yang utama adalah memahami cara kerjanya dan memiliki kontrol yang baik. Apa yang kita sekarang bersama dan pastikan.

Apa itu kompresi audio?

Hal pertama yang harus dipahami sebelum persiapan adalah bahwa kompresi adalah bekerja dengan rentang suara yang dinamis. Dan , pada gilirannya, tidak lebih dari perbedaan antara tingkat sinyal paling keras dan paling tenang:

Jadi begini kompresi adalah kompresi rentang dinamis. Ya, secara sederhana kompresi rentang dinamis, atau dengan kata lain turunkan volume bagian sinyal yang keras dan tingkatkan volume bagian yang tenang. Tidak lagi.

Anda cukup bertanya-tanya apa alasan hype seperti itu? Mengapa semua orang membicarakan resep penyetelan kompresor yang tepat, tetapi tidak ada yang membagikannya? Mengapa, meskipun sejumlah besar plugin keren, apakah banyak studio masih menggunakan kompresor model langka yang mahal? Mengapa beberapa produsen menggunakan kompresor pada pengaturan ekstrim, sementara yang lain tidak menggunakannya sama sekali? Dan mana yang benar pada akhirnya?

Masalah yang dipecahkan oleh kompresi

Jawaban atas pertanyaan semacam itu terletak pada pemahaman tentang peran kompresi dalam bekerja dengan suara. Dan itu memungkinkan:

Tekankan serangan suara, buat lebih jelas;
"Tempatkan" masing-masing bagian instrumen ke dalam campuran, menambahkan kekuatan dan "berat" kepada mereka;
Jadikan kelompok instrumen atau keseluruhan campuran lebih kohesif, seperti monolit tunggal;
Menyelesaikan konflik antar alat menggunakan rantai samping ;
Perbaiki kekurangan vokalis atau musisi, meratakan dinamika mereka;
Dengan pengaturan tertentu bertindak sebagai efek artistik.

Seperti yang Anda lihat, ini adalah proses kreatif yang tidak kalah pentingnya daripada, katakanlah, menciptakan melodi atau memainkan warna nada yang menarik. Dalam hal ini, salah satu tugas di atas dapat diselesaikan menggunakan 4 parameter utama.

Parameter utama kompresor

Terlepas dari banyaknya model perangkat lunak dan perangkat keras kompresor, semua "keajaiban" kompresi terjadi ketika pengaturan yang benar parameter utama: Ambang, Rasio, Serangan dan Rilis. Mari kita pertimbangkan mereka secara lebih rinci:

Ambang atau ambang batas, dB

Parameter ini memungkinkan Anda untuk mengatur nilai di mana kompresor akan beroperasi (yaitu mengompresi sinyal audio). Jadi, jika kita menetapkan ambang batas ke -12dB, kompresor hanya akan bekerja di tempat-tempat dalam rentang dinamis yang melebihi nilai ini. Jika semua suara kita lebih senyap dari -12db, kompresor hanya akan melewatkannya sendiri tanpa memengaruhinya dengan cara apa pun.

Rasio atau rasio aspek

Parameter rasio menentukan seberapa besar sinyal akan dikompresi jika melebihi ambang batas. Sedikit matematika untuk melengkapi gambar: katakanlah kita menyiapkan kompresor dengan ambang -12dB, rasio 2:1 dan menerapkannya lingkaran drum, di mana volume tendangan adalah -4dB. Apa yang akan menjadi hasil dari operasi kompresor dalam kasus ini?

Dalam kasus kami, level tendangan melebihi ambang batas sebesar 8dB. Perbedaan ini akan dikompresi menjadi 4dB (8dB/2) sesuai dengan rasionya. Bersama dengan bagian sinyal yang tidak diproses, ini akan mengarah pada fakta bahwa setelah diproses oleh kompresor, volume tendangan akan menjadi -8db (ambang batas -12dB + sinyal terkompresi 4dB).

Serang, ms

Ini adalah waktu setelah kompresor akan bereaksi melebihi ambang batas. Artinya, jika waktu serangan di atas 0ms kompresor mulai mengompresi melebihi ambang batas sinyal tidak seketika, tetapi setelah waktu yang ditentukan.

Rilis atau pemulihan, ms

Kebalikan dari serangan - nilai parameter ini memungkinkan Anda menentukan berapa lama setelah level sinyal kembali di bawah ambang batas kompresor akan berhenti mengompresi.

Sebelum kita melanjutkan, saya sangat menyarankan untuk mengambil sampel terkenal, memasang kompresor apa pun ke salurannya dan bereksperimen dengan parameter di atas selama 5-10 menit untuk memperbaiki material dengan aman.

Semua parameter lainnya adalah opsional. Mereka dapat berbeda antara model kompresor yang berbeda, yang sebagian mengapa produsen menggunakan model yang berbeda untuk tujuan tertentu (misalnya, satu kompresor untuk vokal, satu lagi untuk grup drum, sepertiga untuk saluran master). Saya tidak akan membahas parameter ini secara rinci, tetapi hanya akan memberikan informasi Umum untuk memahami apa itu semua tentang:

Lutut atau ketegaran (Lutut Keras/Lembut). Parameter ini menentukan seberapa cepat rasio kompresi (rasio) akan diterapkan: keras pada kurva atau halus. Saya perhatikan bahwa dalam mode Lutut Lembut, kompresor tidak bekerja dalam garis lurus, tetapi mulai dengan lancar (sejauh mungkin sesuai ketika kita berbicara tentang milidetik) untuk mengencangkan suara sudah sebelum nilai ambang batas. Untuk memproses kelompok saluran dan campuran keseluruhan, lutut lunak lebih sering digunakan (karena bekerja tanpa terasa), dan lutut keras digunakan untuk menekankan serangan dan fitur lain dari instrumen individu;
Mode Respons: Puncak/RMS. Mode Puncak dibenarkan ketika Anda perlu membatasi semburan amplitudo, serta pada sinyal dengan bentuk kompleks, yang dinamika dan keterbacaannya harus disampaikan sepenuhnya. Mode RMS sangat lembut pada suara, memungkinkan Anda untuk memadatkannya, sambil mempertahankan serangan;
Pemikiran ke Depan (Melihat ke Depan). Ini adalah waktu di mana kompresor akan tahu apa yang diharapkan. Semacam analisis awal dari sinyal yang masuk;
Riasan atau Keuntungan. Parameter yang memungkinkan Anda untuk mengkompensasi penurunan volume akibat kompresi.

Pertama dan nasehat yang paling penting, yang menghilangkan semua pertanyaan lebih lanjut tentang kompresi: jika Anda a) memahami prinsip kompresi, b) Anda benar-benar tahu bagaimana parameter ini atau itu memengaruhi suara, dan c) berhasil mencoba beberapa model yang berbeda — Anda tidak perlu saran apa pun.

Saya benar-benar serius. Jika Anda hati-hati membaca entri ini, bereksperimenlah dengan kompresor biasa Anda DAW dan satu atau dua plugin, tetapi tidak mengerti dalam kasus apa perlu menetapkan nilai serangan besar, yang perbandingan terapkan dan di mana dari mode untuk memproses sinyal sumber - maka Anda akan terus mencari di Internet untuk resep yang sudah jadi, menerapkannya tanpa berpikir di mana saja.

Resep Penyetelan Halus Kompresor itu seperti resep untuk menyempurnakan reverb atau chorus - itu tidak masuk akal dan tidak ada hubungannya dengan kreativitas. Karena itu, saya terus-menerus mengulangi satu-satunya resep yang benar: bekali diri Anda dengan artikel ini, headphone monitor yang bagus, sebuah plug-in untuk kontrol visual bentuk gelombang dan menghabiskan malam di perusahaan beberapa kompresor.

Mengambil tindakan!