Ո՞ր սարքն է նմուշառում ձայնը: Համակարգչային ձայնային համակարգ. Աուդիո թվայնացման որոշ ձևաչափեր համեմատությամբ

PC ձայնային համակարգ, ինչպես ձայնային քարտհայտնվել է 1989 թվականին՝ զգալիորեն ընդլայնելով ԱՀ-ի հնարավորությունները՝ որպես ինֆորմատիզացիայի տեխնիկական միջոց։

PC ձայնային համակարգ -ծրագրային և ապարատային գործիքների մի շարք, որոնք կատարում են հետևյալ գործառույթները.

աուդիո ազդանշանների ձայնագրում արտաքին աղբյուրներից, օրինակ՝ խոսափողից կամ մագնիտոֆոնից՝ մուտքային անալոգային աուդիո ազդանշանները թվայինի վերածելու և այնուհետև դրանք կոշտ սկավառակի վրա պահելու միջոցով.

ձայնագրված աուդիո տվյալների նվագարկումը արտաքին բարձրախոսների համակարգի կամ ականջակալների (ականջակալների) միջոցով.

աուդիո ձայնասկավառակների նվագարկում;

միքսում (խառնում) մի քանի աղբյուրներից ազդանշաններ ձայնագրելիս կամ նվագարկելիս.

աուդիո ազդանշանների միաժամանակյա ձայնագրում և նվագարկում (ռեժիմ Լի Դուպլեքս);

աուդիո ազդանշանի մշակում. ազդանշանի բեկորների խմբագրում, համակցում կամ բաժանում, զտում, դրա մակարդակի փոփոխություն;

աուդիո ազդանշանի մշակում շրջապատի ալգորիթմների համաձայն (եռաչափ - 3 Դ- ձայն) ձայն;

սինթեզատորի միջոցով երաժշտական ​​գործիքների, ինչպես նաև մարդու խոսքի և այլ ձայների առաջացում.

արտաքին էլեկտրոնային երաժշտական ​​գործիքների աշխատանքի վերահսկում հատուկ MIDI ինտերֆեյսի միջոցով:

ԱՀ-ի ձայնային համակարգը կառուցվածքային առումով ձայնային քարտ է, որը տեղադրված է մայր տախտակի բնիկում, կամ ինտեգրված է մեկ այլ համակարգչի ենթահամակարգի մայր տախտակի կամ ընդլայնման քարտի վրա: Ձայնային համակարգի առանձին ֆունկցիոնալ մոդուլներ կարող են իրականացվել որպես ձայնային քարտի համապատասխան բնիկներում տեղադրված դուստր տախտակներ:

Դասական ձայնային համակարգը, ինչպես ցույց է տրված նկ. 5.1-ը պարունակում է.

Աուդիո ձայնագրման և նվագարկման մոդուլ;

    սինթեզատորի մոդուլ;

    ինտերֆեյսի մոդուլ;

    խառնիչ մոդուլ;

    ակուստիկ համակարգ.

Առաջին չորս մոդուլները սովորաբար տեղադրվում են ձայնային քարտի վրա: Ավելին, կան ձայնային քարտեր՝ առանց սինթեզատորի մոդուլի կամ ձայնագրման/նվագարկման մոդուլի թվային ձայն. Մոդուլներից յուրաքանչյուրը կարող է պատրաստվել կամ առանձին միկրոսխեմայի տեսքով, կամ լինել բազմաֆունկցիոնալ միկրոսխեմայի մաս: Այսպիսով, ձայնային համակարգի Chipset-ը կարող է պարունակել ինչպես մի քանի, այնպես էլ մեկ միկրոշրջան:

ԱՀ ձայնային համակարգի դիզայնը զգալի փոփոխությունների է ենթարկվում. կան մայր տախտակներ, որոնց վրա տեղադրված է Chipset ձայնի մշակման համար։

Այնուամենայնիվ, ժամանակակից ձայնային համակարգի մոդուլների նպատակը և գործառույթները (անկախ դրա դիզայնից) չեն փոխվում: Ձայնային քարտի ֆունկցիոնալ մոդուլները դիտարկելիս ընդունված է օգտագործել «Համակարգչի ձայնային համակարգ» կամ «ձայնային քարտ» տերմինները։

2. Ձայնագրման և նվագարկման մոդուլ

Ձայնային համակարգի ձայնագրման և նվագարկման մոդուլը կատարում է անալոգային-թվային և թվային-անալոգային փոխարկումներ ձայնային տվյալների ծրագրային փոխանցման կամ դրանց փոխանցման DMA ալիքների միջոցով: (ուղիղ Հիշողություն Մուտք - ուղղակի հիշողության հասանելիության ալիք):

Ձայնը, ինչպես գիտեք, երկայնական ալիք է, որն ազատորեն տարածվում է օդում կամ այլ միջավայրում, հետևաբար. ձայնային ազդանշանանընդհատ փոփոխվող ժամանակի և տարածության մեջ:

Ձայնագրումը ձայնագրման պահին ձայնային ճնշման տատանումների մասին տեղեկատվության պահպանումն է: Ներկայումս ձայնային տեղեկատվության ձայնագրման և փոխանցման համար օգտագործվում են անալոգային և թվային ազդանշաններ: Այլ կերպ ասած, աուդիո ազդանշանը կարող է ներկայացվել անալոգային կամ թվային տեսքով:

Երբ ձայնը ձայնագրվում է խոսափողի միջոցով, որը ժամանակի շարունակական ձայնային ազդանշանը վերածում է ժամանակի շարունակական էլեկտրական ազդանշանի, ստացվում է անալոգային ձայնային ազդանշան: Քանի որ ձայնային ալիքի ամպլիտուդը որոշում է ձայնի բարձրությունը, իսկ դրա հաճախականությունը՝ ձայնի տոնայնության բարձրությունը, ձայնի մասին հավաստի տեղեկատվություն պահպանելու համար էլեկտրական ազդանշանի լարումը պետք է համաչափ լինի ձայնի ճնշմանը, և դրա հաճախականությունը պետք է համապատասխանի ձայնային ճնշման տատանումների հաճախականությանը:

Շատ դեպքերում աուդիո ազդանշանը սնվում է համակարգչի ձայնային քարտի մուտքին անալոգային տեսքով: Հաշվի առնելով այն հանգամանքը, որ ԱՀ-ն աշխատում է միայն թվային ազդանշաններով, անալոգային ազդանշանը պետք է վերածվի թվայինի: Միևնույն ժամանակ, ԱՀ ձայնային քարտի ելքի վրա տեղադրված բարձրախոսների համակարգը ընկալում է միայն անալոգային էլեկտրական ազդանշաններ, հետևաբար, ԱՀ-ով ազդանշանի մշակումից հետո անհրաժեշտ է թվային ազդանշանը վերածել անալոգային:

Անալոգային թվային փոխարկումներկայացնում է անալոգային ազդանշանի վերածումը թվայինի և բաղկացած է հետևյալ հիմնական փուլերից՝ նմուշառում, քվանտացում և կոդավորում։ Ձայնային ազդանշանի անալոգային թվային փոխակերպման սխեման ներկայացված է նկ. 5.2.

Նախաանալոգային աուդիո ազդանշանը սնվում է անալոգային զտիչով, որը սահմանափակում է ազդանշանի թողունակությունը:

Ազդանշանի նմուշառումը բաղկացած է տվյալ պարբերականությամբ անալոգային ազդանշանի նմուշներից և որոշվում է նմուշառման հաճախականությամբ: Ավելին, նմուշառման հաճախականությունը պետք է լինի սկզբնական ձայնային ազդանշանի ամենաբարձր ներդաշնակության (հաճախականության բաղադրիչի) հաճախականությունից առնվազն երկու անգամ: Քանի որ մարդն ի վիճակի է լսել 20 Հց-ից մինչև 20 կՀց հաճախականության տիրույթի ձայները, նախնական ձայնային ազդանշանի առավելագույն նմուշառման արագությունը պետք է լինի առնվազն 40 կՀց, այսինքն՝ նմուշները պետք է վերցվեն վայրկյանում 40000 անգամ: Արդյունքում, համակարգչի ժամանակակից ձայնային համակարգերի մեծ մասը ձայնային նմուշառման առավելագույն արագություն ունի 44,1 կՀց կամ 48 կՀց:

Ամպլիտուդային քվանտացումը ժամանակի դիսկրետ ազդանշանի ամպլիտուդի ակնթարթային արժեքների չափումն է և դրա փոխակերպումը ժամանակի և ամպլիտուդով դիսկրետ ազդանշանի: Նկ. Նկար 5.3-ը ցույց է տալիս անալոգային ազդանշանի մակարդակի քվանտացման գործընթացը՝ ակնթարթային ամպլիտուդային արժեքներով, որոնք կոդավորված են որպես 3-բիթ թվեր:

Կոդավորումը բաղկացած է քվանտացված ազդանշանը թվային կոդի վերածելուց: Այս դեպքում քվանտացման ժամանակ չափման ճշգրտությունը կախված է կոդ բառի բիթերի քանակից։ Եթե ​​ամպլիտուդային արժեքները գրված են երկուական թվերի միջոցով, և կոդ բառի երկարությունը սահմանված է Նթվանշաններով, կոդային բառերի հնարավոր արժեքների թիվը հավասար կլինի 2 Ն . Կարող է լինել ընթերցման ամպլիտուդի քվանտացման նույնքան մակարդակ: Օրինակ, եթե նմուշի ամպլիտուդի արժեքը ներկայացված է 16-բիթանոց կոդային բառով, ապա ամպլիտուդային աստիճանավորումների առավելագույն քանակը (քվանտացման մակարդակները) կլինի 2 16 = 65 536: 8-բիթանոց ներկայացման համար, համապատասխանաբար, մենք ստանում ենք 2: 8 = 256 ամպլիտուդի աստիճանավորում:

Անալոգային թվային փոխարկումն իրականացվում է հատուկ էլեկտրոնային սարքի միջոցով. անալոգային թվային փոխարկումհեռարձակող(ADC), որտեղ դիսկրետ ազդանշանի նմուշները վերածվում են թվերի հաջորդականության։ Ստացված թվային տվյալների հոսքը, այսինքն. ազդանշանը ներառում է ինչպես օգտակար, այնպես էլ անցանկալի բարձր հաճախականության միջամտություն, որի զտման համար ստացված թվային տվյալները փոխանցվում են թվային ֆիլտրով:

Թվային վերափոխում անալոգայինսովորաբար տեղի է ունենում երկու փուլով, ինչպես ցույց է տրված Նկ. 5.4. Առաջին փուլում ազդանշանի նմուշներն ընտրվում են թվային տվյալների հոսքից՝ օգտագործելով թվային-անալոգային փոխարկիչ (DAC)՝ հետևելով նմուշառման հաճախականությանը: Երկրորդ փուլում դիսկրետ նմուշներից ձևավորվում է շարունակական անալոգային ազդանշան՝ հարթեցման (ինտերպոլացիայի) միջոցով ցածր հաճախականության ֆիլտրի միջոցով, որը ճնշում է դիսկրետ ազդանշանային սպեկտրի պարբերական բաղադրիչները:

Ձայնագրումը և պահպանումը թվային ձևով պահանջում է մեծ քանակությամբ սկավառակի տարածություն: Օրինակ, 60 վայրկյան տևողությամբ ստերեո աուդիո ազդանշանը, որը թվայնացված է 44,1 կՀց նմուշառման հաճախականությամբ 16 բիթ քվանտացման դեպքում, պահեստավորման համար պահանջում է մոտ 10 ՄԲ կոշտ սկավառակի վրա:

Տվյալ որակով աուդիո ազդանշանը ներկայացնելու համար պահանջվող թվային տվյալների քանակությունը նվազեցնելու համար օգտագործվում է սեղմում (սեղմում), որը բաղկացած է (նմուշների քանակի և քվանտացման մակարդակների կամ բիթերի քանակի կրճատմամբ): Ի պառկած մի հաշվի վրա.

Հատուկ կոդավորիչների օգտագործմամբ աուդիո տվյալների կոդավորման նման մեթոդները կարող են նվազեցնել տեղեկատվության հոսքի քանակը մինչև բնօրինակի գրեթե 20% -ը: Ձայնային տեղեկատվության ձայնագրման կոդավորման մեթոդի ընտրությունը կախված է սեղմման ծրագրերի շարքից՝ ձայնային քարտի ծրագրային ապահովման հետ մատակարարվող կամ օպերացիոն համակարգում ներառված կոդեկներից (կոդավորում-վերծանում):

Կատարելով անալոգային-թվային և թվային-անալոգային ազդանշանների փոխակերպման գործառույթները, թվային աուդիո ձայնագրման և նվագարկման մոդուլը պարունակում է ADC, DAC և կառավարման միավոր, որոնք սովորաբար ինտեգրված են մեկ չիպի մեջ, որը նաև կոչվում է կոդեկ: Այս մոդուլի հիմնական բնութագրերն են. նմուշառման արագությունը; ADC-ի և DAC-ի տեսակը և հզորությունը; աուդիո տվյալների կոդավորման մեթոդ; մեջ աշխատելու ունակություն Լի Դուպլեքս.

Նմուշառման արագությունը որոշում է ձայնագրվող կամ նվագարկվող ազդանշանի առավելագույն հաճախականությունը: Մարդկային խոսքը ձայնագրելու և վերարտադրելու համար բավարար է 6 - 8 կՀց; երաժշտություն ցածր որակով - 20 - 25 կՀց; Բարձր որակի ձայնի համար (Աուդիո CD) նմուշառման հաճախականությունը պետք է լինի առնվազն 44 կՀց: Գրեթե բոլոր ձայնային քարտերն աջակցում են ստերեո աուդիո ձայնագրմանը և նվագարկումը 44,1 կՀց կամ 48 կՀց նմուշառման արագությամբ:

ADC-ի և DAC-ի բիթային խորությունը որոշում է թվային ազդանշանի ներկայացման բիթային խորությունը (8, 16 կամ 18 բիթ): Ձայնային քարտերի ճնշող մեծամասնությունը հագեցած է 16-բիթանոց ADC-ով և DAC-ով: Նման ձայնային քարտերը տեսականորեն կարելի է վերագրել Hi-Fi դասին, որը պետք է ապահովի ստուդիայի որակի ձայն: Որոշ ձայնային քարտեր հագեցած են 20 և նույնիսկ 24-բիթանոց ADC-ներով և DAC-ներով, ինչը զգալիորեն բարելավում է ձայնի ձայնագրման/նվագարկման որակը:

Լի Դուպլեքս (լրիվ դուպլեքս) - ալիքով տվյալների փոխանցման ռեժիմ, ըստ որի ձայնային համակարգը կարող է միաժամանակ ստանալ (ձայնագրել) և փոխանցել (նվագարկել) աուդիո տվյալներ: Այնուամենայնիվ, ոչ բոլոր ձայնային քարտերը լիովին աջակցում են այս ռեժիմին, քանի որ դրանք չեն ապահովում ձայնի բարձր որակ տվյալների ինտենսիվ փոխանակմամբ: Նման քարտերը կարող են օգտագործվել ինտերնետում ձայնային տվյալների հետ աշխատելու համար, օրինակ՝ հեռուստակոնֆերանս անցկացնելիս, երբ ձայնի բարձր որակը չի պահանջվում։

Տարբեր ամպլիտուդով և հաճախականությամբ: Որքան բարձր է ազդանշանի ամպլիտուդը, այնքան ավելի բարձր է այն ընկալվում մարդու կողմից։ Որքան բարձր է ազդանշանի հաճախականությունը, այնքան բարձր է նրա տոնը:

Նկար 1. Ձայնային ալիքների տատանումների ամպլիտուդը

Ձայնային ալիքի հաճախականությունըորոշվում է վայրկյանում տատանումների քանակով: Այս արժեքը չափվում է հերցով (Հց, Հց):

Մարդու ականջը ձայներ է ընկալում $20$ Հց-ից $20$ կՀց միջակայքում, այս միջակայքը կոչվում է. ձայն. Բիթերի թիվը, որը վերագրված է մեկ ձայնային ազդանշանին, կոչվում է աուդիո կոդավորման խորությունը. Ժամանակակից ձայնային քարտերն ապահովում են $16-$, $32-$ կամ $64-bit ձայնային կոդավորման խորություն: Կոդավորման գործընթացում ձայնային տեղեկատվությունշարունակական ազդանշանը փոխարինվում է դիսկրետ, այսինքն՝ այն վերածվում է երկուական զրոներից և միավորներից բաղկացած էլեկտրական իմպուլսների հաջորդականության։

Աուդիո նմուշառման արագություն

Մեկը կարևոր հատկանիշներԱուդիո կոդավորման գործընթացի նմուշառման արագությունն է, որը ազդանշանի մակարդակի չափումների քանակն է $1$ վայրկյանում:

  • վայրկյանում մեկ չափումը համապատասխանում է $1$ գիգահերց (ԳՀց) հաճախականությանը.
  • $1000$ չափումները վայրկյանում համապատասխանում են $1$ կիլոհերց (կՀց) հաճախականությանը:

Սահմանում 2

Աուդիո նմուշառման արագությունձայնի ծավալի չափումների թիվն է մեկ վայրկյանում։

Չափումների քանակը կարող է լինել $8$ կՀց մինչև $48$ կՀց միջակայքում, ընդ որում առաջին արժեքը համապատասխանում է ռադիոհեռարձակման հաճախականությանը, իսկ երկրորդը` երաժշտական ​​մեդիայի ձայնի որակին:

Դիտողություն 1

Որքան բարձր է ձայնի հաճախականությունը և նմուշառման խորությունը, այնքան ավելի լավ կհնչի թվայնացված ձայնը: Թվայնացված ձայնի ամենացածր որակը, որը համապատասխանում է որակին հեռախոսային կապ, ստացվում է, որ երբ նմուշառման արագությունը վայրկյանում 8000 անգամ է, նմուշառման խորությունը կազմում է $8$ բիթ, որը համապատասխանում է մեկ աուդիո ուղու ձայնագրմանը («մոնո» ռեժիմ)։ Մեծ մասը բարձրորակթվայնացված ձայնը, որը համապատասխանում է աուդիո ձայնասկավառակի որակին, ստացվում է, երբ նմուշառման արագությունը կազմում է $48,000$ անգամ մեկ վայրկյանում, նմուշառման խորությունը $16$ բիթ է, որը համապատասխանում է երկու ձայնագրությանը։ աուդիո հետքեր(ստերեո ռեժիմ):

Ձայնային ֆայլի տեղեկատվության ծավալը

Հարկ է նշել, որ որքան բարձր է թվային ձայնի որակը, այնքան մեծ է ձայնային ֆայլի տեղեկատվական ծավալը:

Եկեք գնահատենք մոնո աուդիո ֆայլի տեղեկատվության ծավալը ($V$), դա կարելի է անել՝ օգտագործելով բանաձևը.

$V = N \cdot f \cdot k$,

որտեղ $N$-ը ձայնի ընդհանուր տեւողությունն է՝ արտահայտված վայրկյաններով,

$f$ - նմուշառման հաճախականություն (Հց),

$k$ - կոդավորման խորություն (բիթեր):

Օրինակ 1

Օրինակ, եթե ձայնի տևողությունը $1$ րոպե է, և մենք ունենք ձայնի միջին որակ, որի նմուշառման արագությունը $24$ կՀց է, իսկ կոդավորման խորությունը $16$ բիթ է, ապա.

$V=60 \cdot 24000 \cdot 16 \ bits=23040000 \ bits=2880000 \ բայթ=2812,5 \ KB=2,75 \ ՄԲ։$

Ստերեո ձայնը կոդավորելիս նմուշառման գործընթացը կատարվում է առանձին և անկախ ձախ և աջ ալիքների համար, ինչը, համապատասխանաբար, կրկնապատկում է ձայնային ֆայլի ծավալը՝ համեմատած մոնո ձայնի հետ։

Օրինակ 2

Օրինակ, եկեք գնահատենք թվային ստերեո ձայնային ֆայլի տեղեկատվության ծավալը, որի ձայնի տևողությունը $1$ վայրկյան է միջին ձայնի որակով ($16$ բիթ, $24000$ չափումներ մեկ վայրկյանում): Դա անելու համար բազմապատկեք կոդավորման խորությունը $1$ վայրկյանում չափումների քանակով և բազմապատկեք $2$-ով (ստերեո ձայն).

$V=16 \ bits \cdot 24000 \cdot 2 = 768000 \ bits = 96000 \ բայթ = 93,75 \ kb.$

Աուդիո տեղեկատվության կոդավորման հիմնական մեթոդները

Երկուական կոդով աուդիո տեղեկատվության կոդավորման տարբեր մեթոդներ կան, որոնց թվում կան երկու հիմնական ուղղություններ. FM մեթոդԵվ ալիքային աղյուսակի մեթոդ.

FM մեթոդ (հաճախականության մոդուլյացիան) հիմնված է այն փաստի վրա, որ տեսականորեն ցանկացած բարդ ձայն կարող է տրոհվել տարբեր հաճախականությունների պարզ ներդաշնակ ազդանշանների հաջորդականության, որոնցից յուրաքանչյուրը կլինի սովորական սինուսոիդ, ինչը նշանակում է, որ այն կարելի է նկարագրել կոդով։ Ձայնային ազդանշանների տարրալուծման գործընթացը ներդաշնակ շարքերի և դրանց ներկայացումը դիսկրետների տեսքով թվային ազդանշաններտեղի է ունենում հատուկ սարքերում, որոնք կոչվում են անալոգային-թվային փոխարկիչներ (ADC):

Նկար 2. Ձայնային ազդանշանի փոխակերպումը դիսկրետ ազդանշանի

Նկար 2ա-ը ցույց է տալիս ձայնային ազդանշանը ADC-ի մուտքում, իսկ Նկար 2b-ը ցույց է տալիս արդեն փոխարկված դիսկրետ ազդանշանը ADC-ի ելքում:

Հակադարձ փոխակերպման համար ձայնը նվագարկելիս, որը ներկայացված է թվային կոդի տեսքով, օգտագործվում են թվային-անալոգային փոխարկիչներ (DAC): Ձայնի փոխակերպման գործընթացը ներկայացված է Նկ. 3. Կոդավորման այս մեթոդը ձայնի լավ որակ չի տալիս, բայց ապահովում է կոմպակտ կոդ:

Նկար 3. Դիսկրետ ազդանշանը ձայնային ազդանշանի վերածելը

Նկար 3a-ն ցույց է տալիս դիսկրետ ազդանշանը, որը մենք ունենք DAC մուտքի մոտ, իսկ Նկար 3b-ը ցույց է տալիս ձայնային ազդանշանը DAC-ի ելքում:

Սեղանի ալիքի մեթոդ (Ալիքների սեղան) հիմնված է այն փաստի վրա, որ շրջակա աշխարհի ձայների նմուշները պահվում են նախապես պատրաստված աղյուսակներում, Երաժշտական ​​գործիքներԹվային ծածկագրերը արտահայտում են ձայնի բարձրությունը, տևողությունը և ինտենսիվությունը և այլ պարամետրեր, որոնք բնութագրում են ձայնի առանձնահատկությունները: Քանի որ «իրական» հնչյունները օգտագործվում են որպես նմուշներ, սինթեզի արդյունքում ստացված ձայնի որակը շատ բարձր է և մոտենում է իրական երաժշտական ​​գործիքների ձայնային որակին։

Ձայնային ֆայլերի ձևաչափերի օրինակներ

Ձայնային ֆայլերը գալիս են մի քանի ձևաչափերով: Դրանցից ամենատարածվածներն են MIDI, WAV, MP3:

MIDI ձևաչափ(Musical Instrument Digital Interface) ի սկզբանե նախատեսված էր երաժշտական ​​գործիքները կառավարելու համար: Ներկայումս օգտագործվում է էլեկտրոնային երաժշտական ​​գործիքների ոլորտում և համակարգչային մոդուլներսինթեզ.

WAV աուդիո ֆայլի ձևաչափ(ալիքի ձև) ներկայացնում է կամայական ձայն՝ որպես սկզբնական ձայնային ալիքի կամ ձայնային ալիքի թվային ներկայացում: Բոլորը ստանդարտ պատուհանների ձայներըունեն .wav ընդլայնում:

MP3 ֆորմատ(MPEG-1 Audio Layer 3) ձայնային տեղեկատվության պահպանման թվային ձևաչափերից մեկն է: Այն ապահովում է ավելի բարձր որակի կոդավորում:

| Դասի պլանավորում և դասի նյութեր | 10 դաս | Ուսումնական տարվա դասերի պլանավորում | Տեքստի, պատկերի և ձայնի ներկայացում համակարգչում (§ 6)

Դասեր 10 - 12
Տեքստի, պատկերի և ձայնի ներկայացում համակարգչում (§ 6)

Ձայնային տեղեկատվություն

Ձայնային տեղեկատվություն

Ձայնի դիսկրետացման սկզբունքները (ձայնի «թվայնացում») ներկայացված են Նկ. 1.11.

Աուդիոն մուտքագրվում է համակարգիչ՝ օգտագործելով աուդիո սարք (խոսափող, ռադիո և այլն), որի ելքը միացված է պորտին: ձայնային քարտ. Ձայնային քարտի խնդիրն է չափել ձայնային ազդանշանի (վերածված էլեկտրական թրթռումների) մակարդակը որոշակի հաճախականությամբ և գրանցել չափման արդյունքները համակարգչի հիշողության մեջ։ Այս գործընթացը կոչվում է աուդիո թվայնացում:

Երկու չափումների միջև ընկած ժամանակահատվածը կոչվում է չափման ժամանակաշրջան. τ Հետ. Փոխադարձը կոչվում է ընտրանքի չափը - 1/τ (հերց): Որքան բարձր է չափման հաճախականությունը, այնքան բարձր է թվային ձայնի որակը:

Նման չափումների արդյունքները ներկայացված են վերջավոր թվանշաններով դրական ամբողջ թվերով։ Դուք արդեն գիտեք, որ այս դեպքում դուք ստանում եք արժեքների դիսկրետ վերջավոր հավաքածու սահմանափակ տիրույթում: Այս միջակայքի չափը կախված է բջիջի հզորությունից՝ ձայնային քարտի հիշողության ռեգիստրից: Նորից աշխատում է i 2-ի բանաձևը, որտեղ i-ը ռեգիստրի հզորությունն է: i թիվը կոչվում է նաև նմուշառման խորություն։ Ձայնագրված տվյալները պահվում են հատուկ աուդիո ֆորմատի ֆայլերում:

Կան ձայնի մշակման ծրագրեր՝ ձայնային խմբագիրներ, որոնք թույլ են տալիս ստեղծել տարբեր երաժշտական ​​էֆեկտներ, մաքրել ձայնը աղմուկից, կոորդինացնել պատկերների հետ՝ ստեղծելու մուլտիմեդիա արտադրանք և այլն: Ձայն ստեղծող հատուկ սարքերի օգնությամբ ձայնային ֆայլերը կարող են վերածվել ձայնի: ալիքներ, որոնք ընկալվում են մարդու լսողությամբ:

Թվայնացված աուդիո պահելու ժամանակ դուք պետք է լուծեք ձայնը նվազեցնելու խնդիրը ձայնային ֆայլեր. Դա անելու համար, բացի անկորուստ տվյալների կոդավորումից, որը թույլ է տալիս հարյուր տոկոսանոց տվյալների վերականգնում սեղմված հոսքից, օգտագործվում է կորստի տվյալների կոդավորում: Նման կոդավորման նպատակն է հասնել վերականգնված ազդանշանի ձայնի նմանությանը բնօրինակի հետ, երբ առավելագույն սեղմումտվյալները։ Սա ձեռք է բերվում տարբեր ալգորիթմների օգտագործմամբ, որոնք սեղմում են սկզբնական ազդանշանը՝ հեռացնելով նրանից դժվար լսելի տարրերը: Կան բազմաթիվ սեղմման մեթոդներ, ինչպես նաև ծրագրեր, որոնք իրականացնում են այդ մեթոդները:

Օգտագործում է ունիվերսալ աուդիո ձևաչափ՝ առանց կորուստների ձայնը պահպանելու համար WAV ֆայլեր. Մեծ մասը հայտնի ձևաչափ«սեղմված» աուդիո (կորուստ) - MP3: Այն ապահովում է տվյալների սեղմում 10 անգամ կամ ավելի:


Հարցեր և առաջադրանքներ

1. Ե՞րբ են համակարգիչները սկսել աշխատել տեքստի, գրաֆիկայի, ձայնի հետ:
2. Ի՞նչ է կոդավորման աղյուսակը: Որոնք են կոդավորման աղյուսակները:
3. Ինչի՞ վրա է հիմնված պատկերի դիսկրետ ներկայացումը:
4. Ո՞րն է RGB գույնի մոդելը:
5. Գրեք 8 նիշանոց ծածկագիր վառ կապույտ, վառ դեղին (կարմիրի և կանաչի խառնուրդ), գունատ դեղինի համար:
6. Ինչու RGB մոդելը չի ​​օգտագործվում տպագրության մեջ:
7. Ի՞նչ է CMYK-ը:
8. Համակարգչի ո՞ր սարքն է թվայնացնում մուտքային աուդիո ազդանշանը:
9. Ինչպե՞ս է (որակապես) թվային ձայնի որակը կախված նմուշառման արագությունից և նմուշառման արագությունից:
10. Ո՞րն է MP3 ձևաչափի առավելությունը:

Հաջորդ էջը

Աուդիո թվայնացման սկզբունքները

թվային աուդիոանալոգային աուդիո ազդանշան է, որը ներկայացված է իր ամպլիտուդի դիսկրետ թվային արժեքներով:

Աուդիո թվայնացում- բաժանված ժամանակային քայլի տեխնոլոգիա և ստացված արժեքների հետագա գրանցումը թվային տեսքով:
Աուդիո թվայնացման մեկ այլ անուն է անալոգային թվային փոխարկումձայն.

Աուդիո թվայնացումը ներառում է երկու գործընթաց.

  • ժամանակի ընթացքում ազդանշանի նմուշառման (նմուշառման) գործընթացը
  • ամպլիտուդի քվանտացման գործընթաց:

Ժամանակի դիսկրետիզացիա

Ժամանակի դիսկրետացման գործընթաց - փոխակերպվող ազդանշանի արժեքների ստացման գործընթացը որոշակի ժամանակային քայլով. նմուշառման քայլ. Մեկ վայրկյանում կատարված ազդանշանի ուժգնության չափումների թիվը կոչվում է ընտրանքի չափըկամ նմուշառման տոկոսադրույքը, կամ ընտրանքի չափը(անգլերեն «sampling» - «նմուշ»): Որքան փոքր է նմուշառման քայլը, այնքան բարձր է նմուշառման հաճախականությունը և ազդանշանի ավելի ճշգրիտ ներկայացումը մենք կստանանք:
Դա հաստատում է Կոտելնիկովի թեորեմը (արտասահմանյան գրականության մեջ այն հանդիպում է որպես Շենոնի թեորեմ՝ Շենոն)։ Ըստ այդմ, սահմանափակ սպեկտրով անալոգային ազդանշանը ճշգրիտ նկարագրվում է իր ամպլիտուդի արժեքների դիսկրետ հաջորդականությամբ, եթե այդ արժեքները վերցված են ազդանշանի սպեկտրի ամենաբարձր հաճախականությունից առնվազն կրկնակի հաճախականությամբ: Այսինքն, անալոգային ազդանշանը, որում սպեկտրի ամենաբարձր հաճախականությունը F m է, կարող է ճշգրտորեն ներկայացվել դիսկրետ ամպլիտուդի արժեքների հաջորդականությամբ, եթե նմուշառման հաճախականությունը F d է. F d >2F m:
Գործնականում դա նշանակում է, որ որպեսզի թվայնացված ազդանշանը տեղեկատվություն պարունակի բնօրինակ անալոգային ազդանշանի (0 - 20 կՀց) ձայնային հաճախականությունների ամբողջ տիրույթի մասին, անհրաժեշտ է, որ ընտրված նմուշառման արագությունը լինի առնվազն 40 կՀց: Մեկ վայրկյանում ամպլիտուդային նմուշների թիվը կոչվում է ընտրանքի չափը(եթե նմուշառման քայլը հաստատուն է):
Թվայնացման հիմնական դժվարությունը չափված ազդանշանի արժեքները կատարյալ ճշգրտությամբ գրանցելու անհնարինությունն է։

Գծային (միատարր) ամպլիտուդի քվանտացում

Եկեք հատկացնենք N բիթ համակարգչի հիշողության մեջ ազդանշանի ամպլիտուդի մեկ արժեք գրանցելու համար: Սա նշանակում է, որ մեկ N-bit բառի օգնությամբ կարելի է նկարագրել 2 N տարբեր դիրքեր։ Թող թվայնացված ազդանշանի ամպլիտուդը տատանվի որոշ կամայական միավորների -1-ից մինչև 1: Ներկայացնենք ամպլիտուդի փոփոխության այս տիրույթը՝ ազդանշանի դինամիկ միջակայքը, 2 N -1 հավասար ընդմիջումների տեսքով՝ բաժանելով այն 2 N մակարդակների՝ քվանտաների։ Այժմ, յուրաքանչյուր առանձին ամպլիտուդի արժեք գրանցելու համար այն պետք է կլորացվի մինչև քվանտացման մոտակա մակարդակը: Այս գործընթացը կոչվում է ամպլիտուդային քվանտացում: Ամպլիտուդային քվանտացում - ազդանշանի ամպլիտուդի իրական արժեքները որոշակի ճշգրտությամբ մոտավոր արժեքներով փոխարինելու գործընթաց: 2 N հնարավոր մակարդակներից յուրաքանչյուրը կոչվում է քվանտացման մակարդակ, իսկ երկու մոտակա քվանտավորման մակարդակների միջև եղած հեռավորությունը կոչվում է քվանտացման քայլ։ Եթե ​​ամպլիտուդի սանդղակը գծային կերպով բաժանվում է մակարդակների, ապա քվանտացումը կոչվում է գծային (միատարր):
Կլորացման ճշգրտությունը կախված է քվանտացման մակարդակների ընտրված թվից (2 Ն), որն իր հերթին կախված է ամպլիտուդի արժեքը գրանցելու համար հատկացված բիթերի քանակից (N): N թիվը կոչվում է քվանտացման բիթերի խորությունը(նշանակում է թվանշանների քանակը, այսինքն՝ բիթերը յուրաքանչյուր բառում), և ամպլիտուդային արժեքների կլորացման արդյունքում ստացված թվերը. հաշվարկներ կամ նմուշներ(անգլերեն «նմուշ» - «չափում»): Ենթադրվում է, որ 16-բիթանոց քվանտացման արդյունքում առաջացող քվանտացման սխալները գրեթե աննկատ են մնում լսողի համար։ Ազդանշանների թվայնացման այս մեթոդը՝ ազդանշանի նմուշառումը ժամանակին միատարր քվանտացման մեթոդի հետ համատեղ, կոչվում է. զարկերակային կոդի մոդուլյացիա, PCM(eng. Pulse Code Modulation - PCM):
Թվայնացված ազդանշանը որպես հաջորդական ամպլիտուդային արժեքների հավաքածու արդեն կարող է պահվել համակարգչի հիշողության մեջ: Այն դեպքում, երբ գրանցվում են ամպլիտուդի բացարձակ արժեքները, այդպիսին ձայնագրման ձևաչափկանչեց PCM(Pulse Code Modulation): Ստանդարտ աուդիո կոմպակտ սկավառակը (CD-DA), որն օգտագործվում է 1980-ականների սկզբից, պահպանում է տեղեկատվությունը PCM ձևաչափով 44,1 կՀց նմուշառման արագությամբ և 16 բիթ քվանտացման բիտի խորությամբ:

Թվայնացման այլ եղանակներ

Անալոգային թվային փոխարկիչներ (ADC)

Վերոնշյալ աուդիո թվայնացման գործընթացն իրականացվում է անալոգային-թվային փոխարկիչներով (ADC):
Այս փոխակերպումը ներառում է հետևյալ գործողությունները.

  1. Գոտու սահմանափակումն իրականացվում է ցածր անցումային ֆիլտրի միջոցով՝ սպեկտրալ բաղադրիչները ճնշելու համար, որոնց հաճախականությունը գերազանցում է նմուշառման հաճախականության կեսը:
  2. Ժամանակի դիսկրետացում, այսինքն՝ շարունակական անալոգային ազդանշանի փոխարինում ժամանակի դիսկրետ կետերում դրա արժեքների հաջորդականությամբ՝ նմուշներ: Այս խնդիրը լուծվում է ADC-ի մուտքում հատուկ միացում օգտագործելու միջոցով՝ նմուշի և պահելու սարք:
  3. Մակարդակի քվանտացումը ազդանշանի նմուշի արժեքի փոխարինումն է ֆիքսված արժեքների մի շարքից՝ քվանտացման մակարդակներից մոտակա արժեքով:
  4. Կոդավորում կամ թվայնացում, որի արդյունքում յուրաքանչյուր քվանտացված նմուշի արժեքը ներկայացվում է որպես քվանտացման մակարդակի հերթական թվին համապատասխանող թիվ։

Դա արվում է հետևյալ կերպ. շարունակական անալոգային ազդանշանը «կտրվում» է հատվածների, նմուշառման հաճախականությամբ, ստացվում է թվային դիսկրետ ազդանշան, որն անցնում է քվանտացման գործընթացով որոշակի բիթային խորությամբ, այնուհետև կոդավորվում է, այսինքն՝ փոխարինվում։ ծածկագրի նշանների հաջորդականությամբ: 20-20000 Հց հաճախականության տիրույթում ձայն ձայնագրելու համար պահանջվում է 44,1 և ավելի նմուշառման հաճախականություն (ներկայումս ի հայտ են եկել 192 և նույնիսկ 384 կՀց նմուշառման հաճախականությամբ ADC-ներ և DAC-ներ)։ Բարձրորակ ձայնագրություն ստանալու համար բավարար է 16 բիթ խորությունը, սակայն դինամիկ տիրույթն ընդլայնելու և ձայնագրման որակը բարելավելու համար օգտագործվում է 24 (հազվադեպ՝ 32) բիթ խորություն:

Թվայնացված աուդիո կոդավորում՝ նախքան այն մեդիայի վրա ձայնագրելը

Թվային աուդիո պահելու համար կան շատերը տարբեր ձևերով. Թվայնացված ձայնը ազդանշանի ամպլիտուդի արժեքների մի շարք է, որն ընդունվում է որոշակի ժամանակային ընդմիջումներով:

Տերմինաբանություն

  • կոդավորիչ - ծրագիր (կամ սարք), որն իրականացնում է տվյալների կոդավորման որոշակի ալգորիթմ (օրինակ, արխիվատոր կամ MP 3 կոդավորիչ), որն ընդունում է աղբյուրի տեղեկատվությունը որպես մուտքագրում և վերադարձնում է կոդավորված տեղեկատվությունը որոշակի ձևաչափով որպես ելք:
  • ապակոդավորիչ - ծրագիր (կամ սարք), որն իրականացնում է կոդավորված ազդանշանի հակադարձ փոխակերպումը վերծանվածի:
  • կոդեկ (անգլերեն «codec» - «Coder / Decoder») - ծրագրային կամ ապարատային միավոր, որը նախատեսված է տվյալների կոդավորման / վերծանման համար:

Ամենատարածված կոդեկները

  • MP3 - MPEG-1 շերտ 3
  • OGG - Ogg Vorbis
  • WMA- Windows MediaԱուդիո
  • MPC-MusePack
  • AAC - MPEG-2/4 AAC (Ընդլայնված աուդիո կոդավորում)
    • MPEG-2 AAC ստանդարտ
    • MPEG-4 AAC ստանդարտ

Աուդիո թվայնացման որոշ ձևաչափեր համեմատությամբ

Հիմնական հոդված. Ձայնի ձևաչափերի համեմատություն

Ձևաչափի անունը Քվանտացում, բիթ Նմուշառման հաճախականությունը, կՀց Ալիքների քանակը Սկավառակի տվյալների հոսք, կբիթ/վրկ Սեղմման/փաթեթավորման հարաբերակցությունը
16 44,1 2 1411,2 1:1 անկորուստ
Dolby Digital (AC3) 16-24 48 6 մինչև 640 ~12:1 կորուստ
DTS 20-24 48; 96 մինչև 8 մինչև 1536 թ ~3:1 կորուստ
DVD Աուդիո 16; 20; 24 44,1; 48; 88,2; 96 6 6912 2:1 անկորուստ
DVD Աուդիո 16; 20; 24 176,4; 192 2 4608 2:1 անկորուստ
MP3 լողացող մինչև 48 2 մինչև 320 ~11:1 կորուստ
ՇՊԱԿ լողացող մինչև 96 մինչև 48 մինչև 529 թ կորուստներով
AAC+ (SBR) լողացող մինչև 48 2 մինչև 320 կորուստներով
Օգ Վորբիս մինչև 32 մինչև 192 թ մինչև 255 մինչև 1000 կորուստներով
WMA մինչև 24 մինչև 96 մինչև 8 մինչև 768 2:1, կա անկորուստ տարբերակ

Աուդիո փոխակերպման ամբողջական ցիկլ՝ թվայնացումից մինչև սպառողի մոտ նվագարկում

Աուդիո փոխակերպման ամբողջական ցիկլ՝ թվայնացումից մինչև նվագարկում

1. Ո՞ր համակարգչային սարքն է մոդելավորում մարդու մտածողությունը:
-CPU

2. Նախնական տեղեկատվության (փաստերի) վերաբերյալ որոշ կանոնների համաձայն գործողություններ են
- տվյալների մշակում

3. Առաջարկվող հաղորդագրություններից ընտրեք կանոն
- պարզ կոտորակները բազմապատկելիս բազմապատկվում են դրանց համարիչները և հայտարարները

4. Ո՞ւմ համար է ամենայն հավանականությամբ տեղեկատվական լինելու հետևյալ հաղորդագրությունը. «Ծրագիրը ծրագրավորման լեզվով գրված ալգորիթմ է»:
- սկսնակ ծրագրավորող

5. Որտեղ է պահվում գործարկվողը այս պահինծրագիրը և նրա մշակած տվյալները:
- RAM-ում

6. Ո՞ր համակարգչային սարքն է կատարում ձայնի նմուշառման գործընթացը:
- ձայնային քարտ

7. Որոշվում է անձի կողմից ստացված հաղորդագրության տեղեկատվական լինելը
- նոր գիտելիքներ և հասկացողություն

8. Էլիպսների փոխարեն տեղադրեք համապատասխան հասկացությունները.
Ա) ֆայլեր արտաքին հիշողություն

9. Նշեք հրաման(ներ), որոնց կատարումից հետո ընտրված հատվածը հայտնվում է clipboard:
Բ) կտրել և պատճենել

10. Հետևյալ գործողություններից ո՞րն է վերաբերում տեքստի ձևաչափմանը:
- սահմանել հավասարեցման ռեժիմը

11.Կիրառվել է ծրագրային ապահովումներառում է.
Բ) տեքստային խմբագրիչներ

12. Օպերացիոն համակարգն է
- ծրագրերի մի շարք, որոնք կազմակերպում են համակարգչի կառավարումը և նրա փոխգործակցությունը օգտագործողի հետ

13. Առաջարկվող հրամաններ
5 Դարձրեք սկավառակը հոսանք:
2Ստեղծեք TOWN գրացուցակը
3Ստեղծեք STREET գրացուցակը
1Ստեղծեք Home.txt ֆայլ
4 Մուտքագրեք ստեղծված գրացուցակը
Համարակալված հրամանները դասավորեք այնպես, որ ստացվի ալգորիթմ, որը դատարկ սկավառակի վրա ստեղծում է A:\TOWN\STREET\Home.txt լրիվ անվանումով ֆայլ:
Բ) 5,2,3,1

14. Տեքստը պահելու համար պահանջվում է 84000 բիթ: Քանի՞ էջ կտեւի այս տեքստը, եթե էջը պարունակում է 30 տող 70 նիշից յուրաքանչյուր տողում: Տեքստը կոդավորելու համար օգտագործվում է 256 նիշից բաղկացած կոդավորման աղյուսակ։
84000/(log(256)/log(2))/30/70 = 5

15. Գիրքը բաղկացած է 64 էջից։ Յուրաքանչյուր էջ ունի 256 նիշ: Որքա՞ն տեղեկատվություն է պարունակում գրքում, եթե այբուբենը 32 նիշ է:
Ա) 81920 բայթ Բ) 40 ԿԲ Գ) 10 ԿԲ Դ) 16 ԿԲ Ե) 64 ԿԲ
64*256*(log(32)/log(2)) /8/1024 = 10

16. Քանի՞ նիշ է պարունակում 16 նիշանոց այբուբենով գրված հաղորդագրությունը, եթե դրա ծավալը Մեգաբայթի 1/16 է:
(1/16)*1024*1024*8/(log(16)/log(2)) = 131072

17. Որքա՞ն հիշողություն է վերցնում գրաֆիկական պատկերը, եթե դրա չափը 40x60 է, իսկ պիքսելների գույնն օգտագործվում է կոդավորման համար։ երկուական կոդ 32 բիթից:
Ա) 2400 բայթ Բ) 2100 բայթ Գ) 960 բայթ Դ) 9600 բայթ Ե) 12000 բայթ
40*60*32/8 = 9600

18. Տեքստը զբաղեցնում է 0,25 ԿԲ հիշողություն: Քանի՞ նիշ է պարունակում այս տեքստը, եթե օգտագործվում է 256 նիշից բաղկացած կոդավորման աղյուսակ:
0,25*1024*8/(log(256)/log(2)) = 256

19. Քանի՞ բիթ տեղեկատվություն է պարունակում քառորդ Կիլոբայթ հաղորդագրության մեջ:
1/4*1024*8 = 2048