چه دستگاهی از صدا نمونه برداری می کند. سیستم صوتی کامپیوتر. برخی از فرمت های دیجیتالی صوتی در مقایسه

سیستم صوتی کامپیوتر به عنوان کارت صدادر سال 1989 ظاهر شد و به طور قابل توجهی قابلیت های رایانه شخصی را به عنوان وسیله ای فنی برای اطلاع رسانی گسترش داد.

سیستم صوتی کامپیوتر -مجموعه ای از ابزارهای نرم افزاری و سخت افزاری که وظایف زیر را انجام می دهند:

ضبط سیگنال های صوتی از منابع خارجی، مانند میکروفون یا ضبط صوت، با تبدیل سیگنال های صوتی آنالوگ ورودی به دیجیتال و سپس ذخیره آنها بر روی هارد دیسک.

پخش داده های صوتی ضبط شده با استفاده از سیستم بلندگوی خارجی یا هدفون (هدفون)؛

پخش سی دی های صوتی؛

میکس (میکس) هنگام ضبط یا پخش سیگنال از چندین منبع؛

ضبط و پخش همزمان سیگنال های صوتی (حالت پر شده دوبلکس);

پردازش سیگنال صوتی: ویرایش، ترکیب یا تقسیم قطعات سیگنال، فیلتر کردن، تغییر سطح آن.

پردازش سیگنال صوتی مطابق با الگوریتم های فراگیر (سه بعدی - 3 D- صدا) صدا؛

تولید صدای آلات موسیقی و همچنین گفتار انسان و صداهای دیگر با استفاده از سینت سایزر.

کنترل عملکرد آلات موسیقی الکترونیکی خارجی از طریق یک رابط MIDI ویژه.

سیستم صوتی یک رایانه شخصی از نظر ساختاری یک کارت صدا است که یا در شکافی روی مادربرد نصب شده است یا روی مادربرد یا کارت توسعه یک زیرسیستم رایانه شخصی دیگر یکپارچه شده است. ماژول های عملکردی جداگانه سیستم صوتی را می توان به صورت کارت های دختر نصب شده در اسلات های مربوط به کارت صدا پیاده سازی کرد.

سیستم صوتی کلاسیک، همانطور که در شکل نشان داده شده است. 5.1 شامل:

ماژول ضبط و پخش صدا؛

    ماژول سینت سایزر؛

    ماژول رابط؛

    ماژول میکسر؛

    سیستم صوتی

چهار ماژول اول معمولا روی کارت صدا نصب می شوند. علاوه بر این، کارت های صدا بدون ماژول سینت سایزر یا ماژول ضبط / پخش وجود دارد صدای دیجیتال. هر یک از ماژول ها می توانند به شکل یک ریزمدار مجزا ساخته شوند یا بخشی از یک ریز مدار چند منظوره باشند. بنابراین، چیپست یک سیستم صوتی می تواند شامل چندین و یک میکرو مدار باشد.

طراحی سیستم صوتی رایانه شخصی دستخوش تغییرات قابل توجهی شده است. مادربردهایی با چیپست برای پردازش صدا روی آنها نصب شده است.

با این حال، هدف و عملکرد ماژول های یک سیستم صوتی مدرن (صرف نظر از طراحی آن) تغییر نمی کند. هنگام در نظر گرفتن ماژول های عملکردی یک کارت صدا، مرسوم است که از اصطلاحات "سیستم صوتی رایانه شخصی" یا "کارت صدا" استفاده کنید.

2. ماژول ضبط و پخش

ماژول ضبط و پخش سیستم صوتی، تبدیل آنالوگ به دیجیتال و دیجیتال به آنالوگ را در حالت انتقال برنامه داده های صوتی یا انتقال آنها از طریق کانال های DMA انجام می دهد. (مستقیم حافظه دسترسی داشته باشید - کانال دسترسی مستقیم به حافظه).

همانطور که می دانید صدا یک موج طولی است که آزادانه در هوا یا رسانه های دیگر منتشر می شود، بنابراین سیگنال صوتیبه طور مداوم در زمان و مکان تغییر می کند.

ضبط صدا ذخیره سازی اطلاعات مربوط به نوسانات فشار صدا در زمان ضبط است. در حال حاضر از سیگنال های آنالوگ و دیجیتال برای ضبط و انتقال اطلاعات صدا استفاده می شود. به عبارت دیگر، سیگنال صوتی را می توان به صورت آنالوگ یا دیجیتال نشان داد.

هنگامی که صدا با استفاده از میکروفون ضبط می شود که سیگنال صوتی پیوسته زمان را به سیگنال الکتریکی پیوسته زمان تبدیل می کند، سیگنال صوتی آنالوگ به دست می آید. از آنجایی که دامنه موج صوتی بلندی صدا را تعیین می کند و فرکانس آن میزان تن صدا را تعیین می کند، برای حفظ اطلاعات قابل اعتماد در مورد صدا، ولتاژ سیگنال الکتریکی باید متناسب با فشار صدا باشد و فرکانس آن باید با فرکانس نوسانات فشار صدا مطابقت داشته باشد.

در بیشتر موارد، سیگنال صوتی به صورت آنالوگ به ورودی کارت صدای رایانه شخصی وارد می شود. با توجه به اینکه کامپیوتر فقط با سیگنال های دیجیتال کار می کند، سیگنال آنالوگ باید به دیجیتال تبدیل شود. در عین حال، سیستم بلندگوی نصب شده در خروجی کارت صدای رایانه شخصی فقط سیگنال های الکتریکی آنالوگ را درک می کند، بنابراین، پس از پردازش سیگنال با رایانه شخصی، لازم است سیگنال دیجیتال را به آنالوگ تبدیل کنید.

تبدیل آنالوگ به دیجیتالتبدیل سیگنال آنالوگ به دیجیتال را نشان می دهد و از مراحل اصلی زیر تشکیل شده است: نمونه برداری، کوانتیزاسیون و کدگذاری. طرح تبدیل آنالوگ به دیجیتال سیگنال صوتی در شکل نشان داده شده است. 5.2.

سیگنال صوتی پیش آنالوگ به یک فیلتر آنالوگ تغذیه می شود که پهنای باند سیگنال را محدود می کند.

نمونه برداری از سیگنال شامل نمونه برداری از سیگنال آنالوگ با تناوب معین است و با فرکانس نمونه گیری تعیین می شود. علاوه بر این، فرکانس نمونه برداری باید حداقل دو برابر فرکانس بالاترین هارمونیک (مولفه فرکانس) سیگنال صوتی اصلی باشد. از آنجایی که فرد قادر به شنیدن صداهایی در محدوده فرکانس 20 هرتز تا 20 کیلوهرتز است، حداکثر نرخ نمونه برداری از سیگنال صوتی اصلی باید حداقل 40 کیلوهرتز باشد، یعنی نمونه برداری باید 40000 بار در ثانیه باشد. در نتیجه، اکثر سیستم‌های صوتی رایانه‌های شخصی مدرن دارای حداکثر نرخ نمونه‌برداری صوتی 44.1 کیلوهرتز یا 48 کیلوهرتز هستند.

کوانتیزاسیون دامنه اندازه گیری مقادیر لحظه ای دامنه یک سیگنال گسسته زمان و تبدیل آن به سیگنال گسسته در زمان و دامنه است. روی انجیر شکل 5.3 فرآیند کوانتیزاسیون سطح سیگنال آنالوگ را نشان می‌دهد که مقادیر دامنه آنی به صورت اعداد 3 بیتی کدگذاری شده‌اند.

کدگذاری شامل تبدیل یک سیگنال کوانتیزه به یک کد دیجیتال است. در این مورد، دقت اندازه گیری در طول کوانتیزه کردن به تعداد بیت های کلمه رمز بستگی دارد. اگر مقادیر دامنه با استفاده از اعداد باینری نوشته شده باشد و طول کلمه کد تنظیم شود نارقام، تعداد مقادیر ممکن کلمات رمز برابر خواهد بود 2 ن . می تواند به همان تعداد سطوح کوانتیزاسیون دامنه بازخوانی وجود داشته باشد. به عنوان مثال، اگر مقدار دامنه نمونه با یک کلمه کد 16 بیتی نشان داده شود، حداکثر تعداد درجه بندی دامنه (سطوح کوانتیزاسیون) 2 16 = 65 536 خواهد بود. برای یک نمایش 8 بیتی، به ترتیب، 2 8 = 256 درجه بندی دامنه دریافت می کنیم.

تبدیل آنالوگ به دیجیتال توسط یک دستگاه الکترونیکی ویژه انجام می شود - تبدیل آنالوگ به دیجیتالتلویزیونی(ADC)، که در آن نمونه های سیگنال گسسته به دنباله ای از اعداد تبدیل می شوند. جریان داده های دیجیتال دریافتی، یعنی. سیگنال شامل تداخل فرکانس بالا مفید و ناخواسته است که برای فیلتر کردن داده های دیجیتال دریافتی از یک فیلتر دیجیتال عبور می کند.

تبدیل دیجیتال به آنالوگبه طور کلی در دو مرحله رخ می دهد، همانطور که در شکل نشان داده شده است. 5.4. در مرحله اول، نمونه‌های سیگنال از جریان داده‌های دیجیتال با استفاده از مبدل دیجیتال به آنالوگ (DAC) و به دنبال نرخ نمونه‌برداری انتخاب می‌شوند. در مرحله دوم، یک سیگنال آنالوگ پیوسته از نمونه های گسسته با صاف کردن (درون یابی) با استفاده از یک فیلتر فرکانس پایین، که اجزای دوره ای طیف سیگنال گسسته را سرکوب می کند، تشکیل می شود.

ضبط و ذخیره صدا به صورت دیجیتال به فضای دیسک زیادی نیاز دارد. به عنوان مثال، یک سیگنال صوتی استریو 60 ثانیه ای، دیجیتالی شده با فرکانس نمونه برداری 44.1 کیلوهرتز در کوانتیزاسیون 16 بیتی، به حدود 10 مگابایت روی هارد دیسک برای ذخیره سازی نیاز دارد.

برای کاهش مقدار داده های دیجیتال مورد نیاز برای نمایش یک سیگنال صوتی با کیفیت معین، از فشرده سازی (فشرده سازی) استفاده می شود که شامل کاهش (تعداد نمونه ها و سطوح کوانتیزاسیون یا تعداد بیت ها می شود). من دروغ گفتن در یک حساب

چنین روش هایی برای رمزگذاری داده های صوتی با استفاده از رمزگذارهای ویژه می تواند میزان جریان اطلاعات را تقریباً به 20 درصد از نسخه اصلی کاهش دهد. انتخاب روش رمزگذاری برای ضبط اطلاعات صوتی به مجموعه برنامه های فشرده سازی بستگی دارد - کدک ها (رمزگذاری-رمزگشایی) ارائه شده با نرم افزار کارت صدا یا موجود در سیستم عامل.

ماژول ضبط و پخش صدای دیجیتال با انجام عملکردهای تبدیل سیگنال آنالوگ به دیجیتال و دیجیتال به آنالوگ، شامل یک ADC، یک DAC و یک واحد کنترل است که معمولاً در یک تراشه که کدک نیز نامیده می‌شود، ادغام می‌شوند. ویژگی های اصلی این ماژول عبارتند از: نرخ نمونه برداری; نوع و ظرفیت ADC و DAC؛ روشی برای رمزگذاری داده های صوتی؛ توانایی کار در پر شده دوبلکس.

نرخ نمونه برداری حداکثر فرکانس سیگنال ضبط یا پخش شده را تعیین می کند. برای ضبط و بازتولید گفتار انسان، 6 تا 8 کیلوهرتز کافی است. موسیقی با کیفیت پایین - 20 - 25 کیلوهرتز. برای صدای با کیفیت بالا (Audio CD)، فرکانس نمونه برداری باید حداقل 44 کیلوهرتز باشد. تقریباً تمام کارت های صدا از ضبط و پخش صدای استریو با نرخ نمونه برداری 44.1 کیلوهرتز یا 48 کیلوهرتز پشتیبانی می کنند.

عمق بیت ADC و DAC عمق بیت نمایش سیگنال دیجیتال (8، 16 یا 18 بیت) را تعیین می کند. اکثریت قریب به اتفاق کارت های صدا مجهز به ADC و DAC 16 بیتی هستند. از نظر تئوری می توان چنین کارت های صوتی را به کلاس Hi-Fi نسبت داد که باید صدایی با کیفیت استودیو ارائه دهد. برخی از کارت های صدا مجهز به ADC و DAC 20 و حتی 24 بیتی هستند که به طور قابل توجهی کیفیت ضبط / پخش صدا را بهبود می بخشد.

پر شده دوبلکس (دوروی کامل) - یک حالت انتقال داده از طریق یک کانال، که بر اساس آن سیستم صوتی می تواند به طور همزمان داده های صوتی را دریافت (ضبط) و انتقال (پخش) کند. با این حال، همه کارت های صدا به طور کامل از این حالت پشتیبانی نمی کنند، زیرا کیفیت صدای بالایی را با تبادل داده فشرده ارائه نمی دهند. از چنین کارت هایی می توان برای کار با داده های صوتی در اینترنت استفاده کرد، به عنوان مثال، هنگام انجام کنفرانس از راه دور، زمانی که کیفیت صدای بالا مورد نیاز نیست.

با دامنه و فرکانس متفاوت. هر چه دامنه سیگنال بیشتر باشد، توسط شخص بلندتر درک می شود. هر چه فرکانس سیگنال بیشتر باشد، صدای آن بیشتر می شود.

شکل 1. دامنه نوسان امواج صوتی

فرکانس امواج صوتیبا تعداد نوسانات در ثانیه تعیین می شود. این مقدار بر حسب هرتز (هرتز، هرتز) اندازه گیری می شود.

گوش انسان صداهایی را در بازه 20 دلار هرتز تا 20 دلار کیلوهرتز درک می کند که به این محدوده گفته می شود. صدا. تعداد بیت هایی که به یک سیگنال صوتی اختصاص داده می شود نامیده می شود عمق کدگذاری صوتی. کارت های صوتی مدرن عمق رمزگذاری صوتی 16-$، 32-$ یا 64 بیتی را ارائه می دهند. در مرحله کدنویسی اطلاعات صوتیسیگنال پیوسته جایگزین می شود گسسته، یعنی به دنباله ای از تکانه های الکتریکی متشکل از صفر و یک دودویی تبدیل می شود.

نرخ نمونه برداری صوتی

یکی از ویژگی های مهماز فرآیند رمزگذاری صدا، نرخ نمونه برداری است، که تعداد اندازه گیری سطح سیگنال در هر $1 دلار ثانیه است:

  • یک اندازه گیری در هر ثانیه با فرکانس 1 دلار گیگاهرتز (گیگاهرتز) مطابقت دارد.
  • اندازه گیری های 1000 دلاری در هر ثانیه با فرکانس 1 دلار کیلوهرتز (کیلوهرتز) مطابقت دارد.

تعریف 2

نرخ نمونه برداری صوتیتعداد اندازه گیری های حجم صدا در یک ثانیه است.

تعداد اندازه‌گیری‌ها می‌تواند در محدوده 8 دلار کیلوهرتز تا 48 دلار کیلوهرتز باشد که اولین مقدار مربوط به فرکانس پخش رادیویی و دومی - به کیفیت صدای رسانه موسیقی است.

تبصره 1

هرچه فرکانس و عمق نمونه برداری صدا بیشتر باشد، صدای دیجیتالی بهتری پخش می شود. پایین ترین کیفیت صدای دیجیتالی که با کیفیت مطابقت دارد ارتباط تلفنی، معلوم می شود که وقتی نرخ نمونه برداری 8000 بار در ثانیه باشد، عمق نمونه برداری 8 دلار بیت است که مربوط به ضبط یک آهنگ صوتی (حالت "مونو") است. اکثر کیفیت بالاصدای دیجیتالی، که مطابق با کیفیت یک سی دی صوتی است، زمانی به دست می آید که نرخ نمونه برداری 48000 دلار بار در ثانیه باشد، عمق نمونه برداری 16 دلار بیت است، که مربوط به ضبط دو بیت است. آهنگ های صوتی(حالت استریو).

حجم اطلاعات یک فایل صوتی

لازم به ذکر است که هر چه کیفیت صدای دیجیتال بالاتر باشد حجم اطلاعات فایل صوتی بیشتر می شود.

تخمین بزنیم حجم اطلاعاتفایل صوتی مونو ($V$)، این را می توان با استفاده از فرمول انجام داد:

$V = N \cdot f \cdot k$,

که در آن $N$ کل مدت زمان صدا است که بر حسب ثانیه بیان می شود،

$f$ - فرکانس نمونه برداری (هرتز)،

$k$ - عمق رمزگذاری (بیت).

مثال 1

به عنوان مثال، اگر مدت زمان صدا 1 دلار دقیقه باشد و کیفیت صدای متوسطی داشته باشیم که در آن نرخ نمونه برداری 24 دلار کیلوهرتز و عمق رمزگذاری 16 دلار بیت است، پس:

$V=60 \cdot 24000 \cdot 16 \ bits=23040000 \ bits=2880000 \ bytes=2812.5 \ KB=2.75 \ MB.$

هنگام رمزگذاری صدای استریو، فرآیند نمونه برداری به طور جداگانه و مستقل برای کانال های چپ و راست انجام می شود که بر این اساس، حجم فایل صوتی را در مقایسه با صدای مونو دو برابر می کند.

مثال 2

برای مثال، بیایید حجم اطلاعات یک فایل صوتی دیجیتال استریو را تخمین بزنیم که مدت زمان صدای آن 1 دلار در ثانیه با کیفیت صدای متوسط ​​است (بیت‌ها 16 دلار، اندازه‌گیری‌های 24000 دلار در ثانیه). برای انجام این کار، عمق رمزگذاری را در تعداد اندازه‌گیری‌ها در هر $1 دلار در ثانیه ضرب کنید و در $2 (صدای استریو) ضرب کنید:

$V=16 \ bits \cdot 24000 \cdot 2 = 768000 \ بیت = 96000 \ بایت = 93.75 \ کیلوبایت دلار

روش های اساسی برای رمزگذاری اطلاعات صوتی

روش های مختلفی برای رمزگذاری اطلاعات صوتی با یک کد باینری وجود دارد که در میان آنها دو جهت اصلی وجود دارد: روش FMو روش جدول موج.

روش FM (مدولاسیون فرکانس) بر این واقعیت استوار است که از نظر تئوری هر صدای پیچیده ای را می توان به دنباله ای از سیگنال های هارمونیک ساده با فرکانس های مختلف تجزیه کرد، که هر کدام یک سینوسی منظم خواهد بود، به این معنی که می توان آن را با یک کد توصیف کرد. فرآیند تجزیه سیگنال های صوتی به سری هارمونیک و نمایش آنها به صورت گسسته سیگنال های دیجیتالدر دستگاه های خاصی به نام مبدل های آنالوگ به دیجیتال (ADC) رخ می دهد.

شکل 2. تبدیل سیگنال صوتی به سیگنال گسسته

شکل 2a سیگنال صوتی را در ورودی ADC نشان می دهد و شکل 2b سیگنال گسسته از قبل تبدیل شده را در خروجی ADC نشان می دهد.

برای تبدیل معکوس هنگام پخش صدا، که در قالب یک کد عددی ارائه می شود، از مبدل های دیجیتال به آنالوگ (DAC) استفاده می شود. فرآیند تبدیل صدا در شکل نشان داده شده است. 3. این روش کدگذاری کیفیت صدای خوبی نمی دهد، اما یک کد فشرده ارائه می دهد.

شکل 3. تبدیل یک سیگنال گسسته به سیگنال صوتی

شکل 3a سیگنال گسسته ای را که در ورودی DAC داریم و شکل 3b سیگنال صوتی را در خروجی DAC نشان می دهد.

روش موج جدولی (میز موج) بر این اساس است که نمونه هایی از صداهای دنیای اطراف در جداول از پیش آماده شده ذخیره می شود. آلات موسیقیو غیره کدهای عددی زیر و بم، مدت و شدت صدا و سایر پارامترهای مشخص کننده ویژگی های صدا را بیان می کنند. از آنجایی که صداهای "واقعی" به عنوان نمونه استفاده می شوند، کیفیت صدای به دست آمده در نتیجه سنتز بسیار بالا است و به کیفیت صدای آلات موسیقی واقعی نزدیک می شود.

نمونه هایی از فرمت های فایل صوتی

فایل های صوتی در فرمت های مختلفی ارائه می شوند. محبوب ترین آنها MIDI، WAV، MP3 هستند.

فرمت MIDI(Instrument Digital Interface) در اصل برای کنترل آلات موسیقی طراحی شده بود. در حال حاضر در زمینه آلات موسیقی الکترونیک و ماژول های کامپیوترسنتز.

فرمت فایل صوتی WAV(شکل موج) یک صدای دلخواه را به عنوان نمایش دیجیتالی از موج صوتی اصلی یا موج صوتی نشان می دهد. همه استاندارد صدای ویندوزپسوند .wav را داشته باشید.

فرمت MP3(MPEG-1 Audio Layer 3) یکی از فرمت های دیجیتالی برای ذخیره اطلاعات صدا است. کدگذاری با کیفیت بالاتری را ارائه می دهد.

| برنامه ریزی درسی و مواد درسی | 10 کلاس | برنامه ریزی درسی برای سال تحصیلی | نمایش متن، تصویر و صدا در رایانه (§ 6)

درس 10 - 12
نمایش متن، تصویر و صدا در رایانه (§ 6)

اطلاعات صدا

اطلاعات صدا

اصول گسسته سازی صدا ("رقومی سازی" صدا) در شکل 1 نشان داده شده است. 1.11.

صدا با استفاده از یک دستگاه صوتی (میکروفون، رادیو و غیره) به رایانه وارد می شود که خروجی آن به پورت متصل است. کارت صدا. وظیفه کارت صدا اندازه گیری سطح سیگنال صوتی (تبدیل شده به ارتعاشات الکتریکی) با فرکانس مشخص و ثبت نتایج اندازه گیری در حافظه کامپیوتر است. این فرآیند دیجیتالی شدن صدا نامیده می شود.

فاصله زمانی بین دو اندازه گیری را دوره اندازه گیری می نامند - τ با. متقابل نامیده می شود نرخ نمونه - 1/τ (هرتز). هرچه فرکانس اندازه گیری بیشتر باشد، کیفیت صدای دیجیتال بالاتر است.

نتایج چنین اندازه گیری هایی با اعداد صحیح مثبت با تعداد محدودی از رقم ها نشان داده می شود. شما قبلاً می دانید که در این مورد یک مجموعه محدود گسسته از مقادیر در یک محدوده محدود دریافت می کنید. اندازه این محدوده به ظرفیت سلول - رجیستر حافظه کارت صدا بستگی دارد. فرمول 2 i دوباره کار می کند، جایی که i ظرفیت رجیستر است. عدد i را عمق نمونه برداری نیز می گویند. داده های ضبط شده در فایل های فرمت صوتی خاص ذخیره می شوند.

برنامه های پردازش صدا وجود دارد - ویرایشگرهای صدا که به شما امکان ایجاد جلوه های موسیقی مختلف، پاکسازی صدا از نویز، هماهنگی با تصاویر برای ایجاد محصولات چند رسانه ای و غیره را می دهد. با کمک دستگاه های خاصی که صدا تولید می کنند، فایل های صوتی را می توان به امواج صوتی تبدیل کرد که توسط شنوایی انسان درک می شود.

هنگام ذخیره صدای دیجیتالی، باید مشکل کاهش حجم فایل های صوتی را حل کنید. برای انجام این کار، علاوه بر کدگذاری داده های بدون اتلاف، که امکان بازیابی صد درصدی داده ها از یک جریان فشرده را فراهم می کند، از کدگذاری داده های با اتلاف استفاده می شود. هدف از چنین کدگذاری دستیابی به شباهت صدای سیگنال بازیابی شده با سیگنال اصلی است حداکثر فشرده سازیداده ها. این امر با استفاده از الگوریتم‌های مختلفی که سیگنال اصلی را با حذف عناصر غیرقابل شنیدن از آن فشرده می‌کنند، به دست می‌آید. روش های فشرده سازی زیادی و همچنین برنامه هایی وجود دارد که این روش ها را پیاده سازی می کنند.

از یک فرمت صوتی جهانی برای ذخیره صدای بدون اتلاف استفاده می کند فایل های WAV. اکثر فرمت شناخته شدهصدای "فشرده" (از دست رفته) - MP3. فشرده سازی داده ها را 10 برابر یا بیشتر فراهم می کند.


سوالات و وظایف

1. از چه زمانی کامپیوترها با متن، گرافیک و صدا شروع به کار کردند؟
2. جدول رمزگذاری چیست؟ جداول رمزگذاری چیست؟
3. نمایش گسسته یک تصویر بر اساس چیست؟
4. مدل رنگ RGB چیست؟
5. یک کد 8 رقمی برای آبی روشن، زرد روشن (ترکیبی از قرمز و سبز)، زرد کم رنگ بنویسید.
6. چرا از مدل RGB در چاپ استفاده نمی شود؟
7. CMYK چیست؟
8. کدام دستگاه در کامپیوتر سیگنال صوتی ورودی را دیجیتالی می کند؟
9. چگونه (از لحاظ کیفی) کیفیت صدای دیجیتال به میزان نمونه برداری و میزان نمونه گیری بستگی دارد؟
10. مزیت فرمت MP3 چیست؟

صفحه بعد

اصول دیجیتالی سازی صدا

صدای دیجیتالیک سیگنال صوتی آنالوگ است که با مقادیر عددی گسسته دامنه آن نشان داده می شود.

دیجیتالی شدن صدا- فناوری گام زمانی تقسیم شده و ثبت بعدی مقادیر به دست آمده به صورت عددی.
نام دیگر دیجیتالی سازی صدا است تبدیل آنالوگ به دیجیتالصدا.

دیجیتالی کردن صدا شامل دو فرآیند است:

  • فرآیند نمونه برداری (نمونه برداری) یک سیگنال در طول زمان
  • فرآیند کوانتیزاسیون دامنه

گسسته سازی زمان

فرآیند گسسته سازی زمان - فرآیند به دست آوردن مقادیر سیگنال در حال تبدیل، با یک مرحله زمانی خاص - مرحله نمونه برداری. تعداد اندازه گیری های قدرت سیگنال انجام شده در یک ثانیه نامیده می شود نرخ نمونهیا نرخ نمونهبرداری، یا نرخ نمونه(از انگلیسی "نمونه" - "نمونه"). هرچه گام نمونه برداری کوچکتر باشد، فرکانس نمونه برداری بیشتر است و نمایش دقیق تری از سیگنال دریافت می کنیم.
این را قضیه کوتلنیکوف تأیید می کند (در ادبیات خارجی به عنوان قضیه شانون، شانون یافت می شود). بر اساس آن، اگر این مقادیر در فرکانس حداقل دو برابر بالاترین فرکانس طیف سیگنال باشد، یک سیگنال آنالوگ با طیف محدود به طور دقیق توسط یک توالی گسسته از مقادیر دامنه آن توصیف می شود. یعنی یک سیگنال آنالوگ که در آن بالاترین فرکانس طیف Fm است، می‌تواند به‌طور دقیق با دنباله‌ای از مقادیر دامنه گسسته نمایش داده شود، اگر فرکانس نمونه‌برداری F d باشد: F d > 2F m.
در عمل، این بدان معنی است که برای اینکه سیگنال دیجیتالی حاوی اطلاعاتی در مورد کل محدوده فرکانس های شنیداری سیگنال آنالوگ اصلی (0 - 20 کیلوهرتز) باشد، لازم است که نرخ نمونه برداری انتخاب شده حداقل 40 کیلوهرتز باشد. تعداد نمونه های دامنه در ثانیه نامیده می شود نرخ نمونه(اگر مرحله نمونه گیری ثابت باشد).
مشکل اصلی دیجیتالی شدن، عدم امکان ثبت مقادیر سیگنال اندازه گیری شده با دقت کامل است.

کوانتیزاسیون دامنه خطی (همگن).

بیایید N بیت را برای ثبت یک مقدار از دامنه سیگنال در حافظه کامپیوتر اختصاص دهیم. به این معنی که با کمک یک کلمه N-bit می توان 2 N موقعیت مختلف را توصیف کرد. اجازه دهید دامنه سیگنال دیجیتالی شده از 1- تا 1 برخی از واحدهای دلخواه باشد. بیایید این محدوده تغییر دامنه - محدوده دینامیکی سیگنال - را در قالب 2 N -1 بازه مساوی نشان دهیم و آن را به 2 N سطح - کوانتوم تقسیم کنیم. اکنون، برای ثبت هر مقدار دامنه جداگانه، باید آن را به نزدیکترین سطح کوانتیزاسیون گرد کرد. این فرآیند کوانتیزاسیون دامنه نامیده می شود. کوانتیزاسیون دامنه - فرآیند جایگزینی مقادیر واقعی دامنه سیگنال با مقادیر تقریبی با کمی دقت. هر یک از 2 N تراز ممکن را یک سطح کوانتیزه کردن و فاصله بین دو نزدیکترین سطح کوانتیزه شدن را مرحله کوانتیزاسیون می نامند. اگر مقیاس دامنه به صورت خطی به سطوح تقسیم شود، کوانتیزاسیون خطی (همگن) نامیده می شود.
دقت گرد کردن به تعداد انتخاب شده (2 N) سطوح کوانتیزاسیون بستگی دارد که به نوبه خود به تعداد بیت (N) اختصاص داده شده برای ثبت مقدار دامنه بستگی دارد. عدد N نامیده می شود عمق بیت کوانتیزاسیون(به معنای تعداد ارقام، یعنی بیت ها، در هر کلمه)، و اعداد به دست آمده در نتیجه گرد کردن مقادیر دامنه - شمارش یا نمونه(از انگلیسی "نمونه" - "اندازه گیری"). فرض بر این است که خطاهای کوانتیزاسیون ناشی از کوانتیزه سازی 16 بیتی تقریباً برای شنونده نامحسوس باقی می ماند. این روش دیجیتالی کردن سیگنال - نمونه برداری سیگنال در زمان در ترکیب با روش کوانتیزاسیون همگن - نامیده می شود. مدولاسیون کد پالس، PCM(eng. Pulse Code Modulation - PCM).
سیگنال دیجیتالی شده به عنوان مجموعه ای از مقادیر دامنه متوالی می تواند از قبل در حافظه رایانه ذخیره شود. در مواردی که مقادیر مطلق دامنه ثبت می شود، مانند فرمت ضبطتماس گرفت PCM(مدولاسیون کد پالس). دیسک فشرده صوتی استاندارد (CD-DA) که از اوایل دهه 1980 مورد استفاده قرار گرفت، اطلاعات را در قالب PCM با نرخ نمونه برداری 44.1 کیلوهرتز و عمق بیت کوانتیزه 16 بیت ذخیره می کند.

راه های دیگر برای دیجیتالی کردن

مبدل های آنالوگ به دیجیتال (ADC)

فرآیند دیجیتالی سازی صوتی فوق توسط مبدل های آنالوگ به دیجیتال (ADC) انجام می شود.
این تبدیل شامل عملیات زیر است:

  1. محدود کردن باند با استفاده از یک فیلتر پایین گذر برای سرکوب اجزای طیفی که فرکانس آنها بیش از نیمی از فرکانس نمونه برداری است انجام می شود.
  2. گسسته سازی در زمان، یعنی جایگزینی یک سیگنال آنالوگ پیوسته با دنباله ای از مقادیر آن در نقاط گسسته در زمان - نمونه ها. این مشکل با استفاده از یک مدار خاص در ورودی ADC حل می شود - دستگاه نمونه گیری و نگه داشتن.
  3. کوانتیزاسیون سطح جایگزینی مقدار نمونه سیگنال با نزدیکترین مقدار از مجموعه ای از مقادیر ثابت - سطوح کوانتیزاسیون است.
  4. رمزگذاری یا دیجیتالی کردن، در نتیجه مقدار هر نمونه کوانتیزه شده به عنوان عددی مطابق با عدد ترتیبی سطح کوانتیزه نمایش داده می شود.

این کار به شرح زیر انجام می شود: یک سیگنال آنالوگ پیوسته به بخش ها "برش" می شود، با فرکانس نمونه برداری، یک سیگنال گسسته دیجیتال به دست می آید که فرآیند کوانتیزاسیون را با عمق بیت مشخصی طی می کند و سپس کدگذاری می شود، یعنی با دنباله ای از نمادهای کد جایگزین می شود. برای ضبط صدا در باند فرکانسی 20-20000 هرتز، فرکانس نمونه برداری 44.1 و بالاتر مورد نیاز است (در حال حاضر ADC و DAC با فرکانس نمونه برداری 192 و حتی 384 کیلوهرتز ظاهر شده اند). برای به دست آوردن یک ضبط با کیفیت بالا، عمق کمی 16 بیت کافی است، اما برای گسترش دامنه دینامیکی و بهبود کیفیت ضبط صدا، از عمق کمی 24 (به ندرت 32) بیت استفاده می شود.

رمزگذاری صدای دیجیتالی قبل از ضبط آن در رسانه

برای ذخیره صدای دیجیتال، موارد زیادی وجود دارد راه های مختلف. صدای دیجیتالی مجموعه ای از مقادیر دامنه سیگنال است که در بازه های زمانی معین گرفته می شود.

واژه شناسی

  • رمزگذار - یک برنامه (یا دستگاه) که یک الگوریتم رمزگذاری داده خاص را پیاده سازی می کند (مثلاً یک بایگانی کننده یا یک رمزگذار MP 3)، که اطلاعات منبع را به عنوان ورودی می پذیرد و اطلاعات رمزگذاری شده را در قالب خاصی به عنوان خروجی برمی گرداند.
  • رمزگشا - یک برنامه (یا دستگاه) که تبدیل معکوس یک سیگنال رمزگذاری شده را به یک سیگنال رمزگشایی شده پیاده سازی می کند.
  • کدک (از انگلیسی "codec" - "Coder / Decoder") - یک واحد نرم افزار یا سخت افزاری است که برای رمزگذاری / رمزگشایی داده ها طراحی شده است.

رایج ترین کدک ها

  • MP3 - MPEG-1 Layer 3
  • OGG - Ogg Vorbis
  • WMA- ویندوز مدیاسمعی
  • MPC-MusePack
  • AAC - MPEG-2/4 AAC (کدگذاری صوتی پیشرفته)
    • استاندارد MPEG-2 AAC
    • استاندارد MPEG-4 AAC

برخی از فرمت های دیجیتالی صوتی در مقایسه

مقاله اصلی: مقایسه فرمت های صدا

نام قالب کوانتیزاسیون، بیت فرکانس نمونه برداری، کیلوهرتز تعداد کانال ها جریان داده دیسک، kbit/s نسبت فشرده سازی / بسته بندی
16 44,1 2 1411,2 1:1 بدون باخت
Dolby Digital (AC3) 16-24 48 6 تا 640 ~12:1 باخت
DTS 20-24 48; 96 تا 8 قبل از 1536 ~ 3:1 باخت
DVD صوتی 16; 20; 24 44,1; 48; 88,2; 96 6 6912 2:1 بدون باخت
DVD صوتی 16; 20; 24 176,4; 192 2 4608 2:1 بدون باخت
MP3 شناور تا 48 2 تا 320 ~11:1 باخت
AAC شناور تا سال 96 تا 48 تا 529 با ضرر و زیان
AAC+ (SBR) شناور تا 48 2 تا 320 با ضرر و زیان
اوگ وربیس تا 32 تا 192 تا 255 تا 1000 با ضرر و زیان
WMA تا 24 تا سال 96 تا 8 تا 768 2:1، نسخه بدون ضرر وجود دارد

چرخه کامل تبدیل صوتی: از دیجیتالی شدن تا پخش در مصرف کننده

چرخه کامل تبدیل صوتی: از دیجیتالی شدن تا پخش

1. کدام دستگاه کامپیوتری تفکر انسان را مدل می کند؟
-CPU

2. اقدامات بر روی اطلاعات اولیه (حقایق) مطابق با برخی قوانین می باشد
-پردازش داده ها

3. یک قانون از پیام های پیشنهادی انتخاب کنید
- هنگام ضرب کسرهای ساده، صورت و مخرج آنها ضرب می شود

4. پیام زیر برای چه کسانی بیشتر آموزنده است: "برنامه الگوریتمی است که به زبان برنامه نویسی نوشته شده است"؟
- برنامه نویس مبتدی

5. فایل اجرایی در کجا ذخیره می شود این لحظهبرنامه و داده هایی که پردازش می کند؟
-در رم

6. چه دستگاه کامپیوتری فرآیند نمونه برداری صدا را انجام می دهد؟
-کارت صدا

7. آموزنده بودن پیام دریافتی توسط شخص مشخص می شود
- دانش و درک جدید

8. به جای بیضی، مفاهیم مناسب را وارد کنید: "دایرکتوری حاوی اطلاعاتی در مورد ... ذخیره شده در ... است."
الف) فایل ها حافظه خارجی

9. دستور(هایی) را مشخص کنید که پس از اجرای آن، قطعه انتخاب شده به کلیپ بورد می رسد.
ب) برش و کپی کنید

10. کدام یک از اقدامات زیر مربوط به قالب بندی متن است؟
تنظیم حالت تراز

11. کاربردی نرم افزارشامل می شود:
ب) ویرایشگرهای متن

12. سیستم عامل است
- مجموعه ای از برنامه ها که مدیریت کامپیوتر و تعامل آن با کاربر را سازماندهی می کند

13. دستورات پیشنهادی
5 درایو را جریان دهید.
2 دایرکتوری TOWN را ایجاد کنید
3 دایرکتوری STREET را ایجاد کنید
1فایل Home.txt را ایجاد کنید
4 دایرکتوری ایجاد شده را وارد کنید
دستورات شماره گذاری شده را طوری تنظیم کنید که الگوریتمی به دست آید که فایلی با نام کامل A:\TOWN\STREET\Home.txt روی یک دیسکت خالی ایجاد کند.
ب) 5،2،3،1

14. برای ذخیره متن 84000 بیت طول می کشد. اگر صفحه دارای 30 خط 70 کاراکتری در هر خط باشد، این متن چند صفحه خواهد داشت؟ برای رمزگذاری متن از یک جدول رمزگذاری متشکل از 256 کاراکتر استفاده می شود.
84000/(log(256)/log(2))/30/70 = 5

15. کتاب شامل 64 صفحه است. هر صفحه 256 کاراکتر دارد. اگر الفبای آن 32 کاراکتر باشد چه مقدار اطلاعات در کتاب موجود است؟
الف) 81920 بایت ب) 40 کیلوبایت ج) 10 کیلوبایت د) 16 کیلوبایت E) 64 کیلوبایت
64*256*(log(32)/log(2)) /8/1024 = 10

16. یک پیام نوشته شده با الفبای 16 کاراکتری در صورتی که حجم آن 1/16 مگابایت باشد چند کاراکتر دارد؟
(1/16)*1024*1024*8/(log(16)/log(2)) = 131072

17. اگر اندازه یک تصویر گرافیکی 40x60 باشد و از رنگ پیکسل برای رمزگذاری استفاده شود، چقدر حافظه می گیرد. کد باینریاز 32 بیت
الف) 2400 بایت ب) 2100 بایت ج) 960 بایت د) 9600 بایت E) 12000 بایت
40*60*32/8 = 9600

18. متن 0.25 کیلوبایت حافظه اشغال می کند. اگر از جدول رمزگذاری 256 کاراکتری استفاده شود، این متن حاوی چند کاراکتر است؟
0.25*1024*8/(log(256)/log(2)) = 256

19. در یک چهارم کیلوبایت پیام چند بیت اطلاعات وجود دارد؟
1/4*1024*8 = 2048