Adâncimea codării sunetului este ceea ce? Definiție, formulă

Codarea audio se referă la metodele de stocare și transmitere a datelor audio. Următorul articol descrie modul în care funcționează aceste codificări.

Rețineți că acesta este un subiect destul de complicat - "Adâncimea codării sunetului". Definiția acestui concept va fi de asemenea prezentată în articolul nostru. Conceptele prezentate în acest articol sunt destinate exclusiv revizuirii generale. Să dezvăluim conceptele profunzimii codării sunetului. Unele dintre aceste date de referință pot fi utile pentru înțelegerea modului în care API funcționează și pentru a formula și procesa audio în aplicațiile dvs.

Cum să găsiți profunzimea codării sunetului

Formatul audio nu este echivalent cu codificarea audio. De exemplu, un format de fișier popular, cum ar fi WAV, determină formatul antetului fișierului audio, dar nu este în sine o codificare a sunetului. Fișiere audio WAV de multe ori, dar nu utilizați întotdeauna codare PCM liniar.

În schimb, FLAC este atât un format de fișier, cât și o codificare, ceea ce uneori duce la o anumită confuzie. În cadrul API FLAC pentru vorbire, adâncimea codării audio este singura codificare care necesită ca datele audio să includă un antet. Toate celelalte codificări indică date audio silențioase. Când ne referim la FLAC în API-ul de vorbire, ne referim mereu la codec. Când ne referim la formatul de fișier FLAC, vom folosi formatul ".FLAC".adâncimea de codare a sunetului este

Nu este necesar să specificați codificarea și rata de eșantionare pentru fișierele WAV sau FLAC. Dacă acest parametru este omis, API-ul Cloud determină automat rata de codare și de eșantionare pentru fișierele WAV sau FLAC pe baza antetului fișierului. Dacă specificați o valoare de codificare sau o rată de eșantionare care nu se potrivește cu valoarea din antetul fișierului, API-ul cloud va afișa o eroare.

Adâncimea codării sunetului este ceea ce?

Audio constă în oscilograme formate din unde interpolate de frecvențe și amplitudini diferite. Pentru a reprezenta aceste forme de undă în medii digitale, semnalele trebuie respinse la o rată care poate reprezenta cele mai înalte sunete de frecvență pe care doriți să le reproduceți. De asemenea, este necesar ca aceștia să stocheze o adâncime suficientă a biților pentru a reprezenta amplitudinea corectă (intensitatea și moaleitatea) oscilogramelor în funcție de eșantionul de sunet.

Abilitatea unui dispozitiv de procesare a sunetului de a recrea frecvențele este cunoscută drept răspunsul său în frecvență, iar abilitatea de a crea o luminozitate și o ușurință adecvată este cunoscută ca o gamă dinamică. Împreună, acești termeni sunt adesea numiți fidelitatea unui dispozitiv audio. Adâncimea codării sunetului este un mijloc prin care puteți restaura sunetul utilizând aceste două principii de bază, precum și capacitatea de a stoca și transmite în mod eficient astfel de date.

Rata de eșantionare

Sunetul există ca o formă de undă analogică. Segmentul de sunet digital aproximează acest val analogic și își eșantionează amplitudinea cu o viteză suficient de mare pentru a simula frecvențele naturale ale undei. Frecvența de eșantionare a semnalului audio digital determină numărul de probe prelevate din material audio original (pe secundă). Rata de eșantionare ridicată mărește capacitatea sunetului digital de a reprezenta cu acuratețe înalte frecvențe.adâncimea codării sunetului este de 8 biți

Ca o consecință a teoremei de eșantionare Nyquist-Shannon, de obicei, trebuie să încercați cel puțin de două ori frecvența oricărui val de sunet pentru a fi înregistrate în format digital. De exemplu, pentru a reprezenta sunetul în intervalul auzului uman (20-20000 Hz), format audio digital ar trebui să afișeze cel puțin 40.000 de ori pe secundă (care este motivul pentru care CD-ul de sunet utilizează o frecvență de eșantionare 44100 Hz).

Bila de adâncime

Adâncimea codării sunetului este efectul asupra domeniului dinamic al unei probe de sunet date. O adâncime de biți mai mare permite amplitudini mai precise. Dacă aveți o mulțime de sunete puternice și silențioase în aceeași probă de sunet, veți avea nevoie de mai mulți biți pentru a transmite în mod corect aceste sunete.

De asemenea, adâncimile de biți mai mari reduc raportul semnal-zgomot în probele audio. Dacă adâncimea codării audio este de 16 biți, sunetul muzical al CD-ului este transmis utilizând aceste valori. Unele metode de compresie pot compensa adâncimi de biți mai mici, dar de obicei sunt pierderi. DVD Audio utilizează 24 de biți de adâncime, în timp ce la majoritatea telefoanelor, adâncimea codării audio este de 8 biți.Dacă adâncimea codării audio este de 16 biți

Audio necomprimat

Majoritatea procesării digitale a sunetului utilizează aceste două metode (frecvența de eșantionare și adâncimea de biți) pentru stocarea audio simplă a datelor. Una dintre cele mai populare tehnologii digitale de sunet (popularizată cu ajutorul unui CD) este cunoscută sub numele de modulație a codurilor pulsale (sau PCM). Se selectează audio la intervale stabilite, iar amplitudinea undei eșantionate în acest punct este stocată ca o valoare digitală utilizând adâncimea de biți a eșantionului.

Linear PCM (ceea ce indică faptul că răspunsul amplitudine este proba omogenă liniar) este standardul utilizat în CD și codificat LINEAR16 Speech API. Ambele codificări creează un flux octet necomprimat care corespunde direct cu datele audio și ambele standarde conțin 16 biți de adâncime. Linear PCM utilizează o rată de eșantionare de 44,100Hz pe CD-uri, care este potrivită pentru re-compunerea muzicii. Cu toate acestea, frecvența de eșantionare de 16.000 Hz este mai potrivită pentru recompunerea vocală.



Linear PCM (LINEAR16) este un sunet necomprimat exemplu, deoarece datele digitale stocate într-un mod similar. La citirea unui flux de un singur canal de octeți, codificate folosind Linear PCM, puteți calcula la fiecare 16 biți (2 octeți) pentru diferite valori ale amplitudinii semnalului. astfel de date digitale Aproape toate dispozitivele pot fi manipulate inițial - pot fi tăiate Linear PCM fișiere audio cu un editor de text, dar sunet necomprimat - nu cea mai eficientă metodă de transport sau de stocare audio digital. Din acest motiv, majoritatea audio utilizează metode de comprimare digitală.

Sunet comprimat

Datele audio, precum toate datele, sunt adesea comprimate, ceea ce facilitează stocarea și transportul acestora. Compresia în codarea audio poate avea loc fie fără pierdere, fie cu pierdere. Compresia fără pierderi poate fi decomprimată pentru a restaura datele digitale în forma lor originală. Comprimarea elimină în mod necesar unele informații în timpul procedurii de decompresie și este parametrizată pentru a indica gradul de toleranță la tehnica de compresie pentru ștergerea datelor.extindeți conceptele de profunzime a codării sunetului

lossless

Fără pierderi, sunetul digital este comprimat, folosind permutări complexe ale datelor stocate, ceea ce nu duce la o deteriorare a calității eșantionului digital original. Cu compresie fără pierderi, atunci când datele sunt despachetate în forma digitală originală, informațiile nu vor fi pierdute.

Deci, de ce metode de compresie fără pierderi au uneori parametri de optimizare? Acești parametri deseori procesează dimensiunea fișierului pentru timpul de decompresie. De exemplu, FLAC utilizează un parametru de nivel de compresie de la 0 (cel mai rapid) la 8 (cea mai mică dimensiune a fișierului). O compresie FLAC mai mare nu va pierde nicio informație în comparație cu o comprimare la nivel inferior. În schimb, algoritmul de compresie va trebui pur și simplu să cheltuiască mai multă putere de calcul atunci când construiește sau deconstruie sunetul digital original.

API-ul Speech acceptă două codificări fără pierderi: FLAC și LINEAR16. Din punct de vedere tehnic, LINEAR16 nu este o "compresie fără pierderi", deoarece comprimarea nu este folosită în primul rând. Dacă dimensiunea fișierului sau transferul de date este important pentru dvs., selectați FLAC ca opțiune de codare a sunetului.

Pierderea compresiei

Comprimarea datelor audio elimină sau reduce anumite tipuri de informații atunci când construiesc date comprimate. Speech API acceptă mai multe formate pierdute, deși acestea ar trebui evitate, deoarece pierderea datelor poate afecta acuratețea recunoașterii.sunetul de codare a sunetului

Un codec MP3 popular este un exemplu de metodă de codificare a pierderilor. Toate metodele de comprimare MP3 elimină sunetul din afara domeniului normal al sunetului unei persoane și ajustează nivelul de compresie prin ajustarea ratei efective a datelor a codecului MP3 sau a numărului de biți pe secundă pentru stocarea datei audio.

De exemplu, un CD stereo care utilizează un PCM liniar de 16 biți are o rată efectivă de biți. Formula pentru adâncimea codării sunetului:

441000 * 2 canale * 16 biți = 1411200 biți pe secundă (bps) = 1411 Kbps

De exemplu, compresia MP3 elimină astfel de date digitale utilizând rate de date, cum ar fi 320 kbit / s, 128 kbps sau 96 kbps, ceea ce duce la o degradare a calității sunetului. MP3 suportă, de asemenea, rate de biți variabile, care pot comprima audio mai mult. Ambele metode pierd informații și pot afecta calitatea. Cu încredere, putem spune că majoritatea oamenilor pot determina diferența dintre muzica MP3 codată 96 kbit / s sau 128 kbps.codarea profunzimii definiției sunetului

Alte forme de compresie

MULAW - o codificare PCM de 8 biți, în cazul în care proba este modulat în amplitudine logaritmic, mai degrabă decât liniar. Ca rezultat, uLaw reduce intervalul dinamic eficient audio comprimat. Deși uLaw a fost introdus în mod specific pentru a optimiza de codificare vorbire, în contrast cu alte tipuri de audio, pe 16 biți LINEAR16 (PCM necomprimat) este încă mult superioară față de 8-biți sunet comprimat uLaw.

AMR și AMR_WB modulează casetele audio codate introducând o rată de biți variabilă în proba audio originală.Cum să găsiți profunzimea codării sunetului

Deși API-ul de vorbire suportă mai multe formate pierdute, ar trebui să le evitați dacă aveți control asupra sursei audio. Deși ștergerea acestor date prin comprimarea pierdute poate să nu aibă un efect semnificativ asupra sunetului audiat de urechea umană, pierderea unor astfel de date pentru mecanismul de recunoaștere a vorbirii poate afecta semnificativ precizia.

Distribuiți pe rețelele sociale:

înrudit
Alegeți un program pentru înregistrarea sunetului de la un microfonAlegeți un program pentru înregistrarea sunetului de la un microfon
Editor de fișiere audio: prezentare generală a programuluiEditor de fișiere audio: prezentare generală a programului
Care este diferența dintre formatul FLAC și alte codecuri audio digitale?Care este diferența dintre formatul FLAC și alte codecuri audio digitale?
Care este formatul AAC?Care este formatul AAC?
Un fișier audio este ce format și ce extensie?Un fișier audio este ce format și ce extensie?
De ce codificarea binară este universală? Metode de programareDe ce codificarea binară este universală? Metode de programare
Formatul MP3: descriere, programe pentru conversieFormatul MP3: descriere, programe pentru conversie
Convert: cum se convertesc mp3-ul în wav și inversConvert: cum se convertesc mp3-ul în wav și invers
Convertor: ce este asta? Principalele tipuri de transformări.Convertor: ce este asta? Principalele tipuri de transformări.
Mai degrabă decât să deschidă flac?Mai degrabă decât să deschidă flac?
» » Adâncimea codării sunetului este ceea ce? Definiție, formulă