آیا صدای ما در تلفن اینترنتی دچار تاخیر هم می شود؟
بستههاي VOIP
براي برقراري يك ارتباط VOIP در سختافزارهاي كاربري كار نمونهبرداري از صدا صورت ميگيرد. به طور معمول صدايي به طول تقريبي 10 تا 20 ميلي ثانيه در بسته (Packet) اطلاعاتي جهت ارسال قرار ميگيرد. البته انواع Codec (رمز گذاري و رمزگشايي) تعريف شدهاند كه هركدام استاندارد خاص خود را به منظور نمونهبرداري و ارسال صدا تعريف ميكنند. هر بسته VOIP طولي كمتر از 100 بايت دارد كه پروتكل لايه ارسال(Transfer Protocol) UDP را جهت مسافرت بر روي شبكه IP انتخاب ميكند. 20 تا 40 بايت اول بسته VOIP حاوي IP مقصد است. 8 بايتي كه به دنبال آن ميآيد حاوي صدايي است كه در بازه زماني 10 تا 20 ميلي ثانيه نمونهبرداري شده است. سپس 12 بايت كه اطلاعاتي از نوع پروتكل RTP را داراست در ادامه آن ميآيد. در ادامه همين مقاله توضيحاتي را در مورد اين پروتكل بيان خواهيم كرد. بالاخره در 33 بايت انتهايي اين بسته اطلاعاتي در مورد نحوه كدگذاري و كدگشايي اين بسته (Codec Info) قرار ميگيرد.
وابسته به Codec در نظر گرفته شده در انتقال صدا، بستههاي VOIP مدتي را در سمت ديگر (دريافت كننده صدا) منتظر ميمانند تا كار بافر شدن آنها به حد تعيين شده برسد. با رسيدن حجم بستهها در بافر سمت دريافت كننده به اندازه تعيين شده، صدا در سمت ديگر پخش خواهد شد.
تاخير صدا
بستههاي VOIP يكي پس از ديگري از سمتي ارسال و در سمت ديگر بافر ميشوند و پس از رسيدن بافر به اندازهاي مشخص (و يا گذشتن زماني از پيش تعيين شده) صدا پخش ميشود. اين كار در حالت ايدهآل به نحوي انجام ميگيرد كه شنونده صدا متوجه هيچ تاخيري در شنيدن صدا نشود.
تاخير صدا به عنوان يكي از مهمترين عاملهاي كيفيت صدا نقش مهمي در شكلگيري يك ارتباط صوتي مطلوب دارد. چنانچه اين تاخير از حدي بيشتر شود، ادامه مكالمه ميسر نخواهد بود. اين همان تاخيري است كه شايد در هنگام يك مكالمه تلفني راه دور كه با استفاده از كارت تلفني انجام ميگيرد، متوجه آن شده باشيد. چنانچه تاخير صدا بيشتر از 200 ميلي ثانيه شود، مكالمه تلفني را از حالت مطلوب خارج ميكند و كاربران را دچار مشكل ميسازد. هر اندازه اين تاخير كاهش يابد به يك مكالمه ايده آل تلفني نزديک تر ميشويم.
عامل تاخير صدا به عنوان بزرگترين چالش در فناوري VOIP مطرح بوده و هست. تاخير صدا به علت تكنولوژي انتخاب شده در شبكههاي مخابراتي سنتي در عمل ناچيز و قابل چشمپوشي است اما درVOIP همه چيز به طور كامل متفاوت است. راهكارهاي مختلف كه به منظور كاهش تاخير اعمال شدهاند و همچنين پيشرفت فناوري ارتباطات و اينترنت موجب شده است كه تاخير يك ارتباط VOIP كه در گذشتهاي نه چندان دور به بيش از 600 ميلي ثانيه ميرسيد و در عمل ادامه مكالمه را ناممكن ميساخت به حد مطلوب 100 ميلي ثانيه برسد.
به منظور مقابله با تاخير صداي احتمالي كه به هر دليل و از جمله ترافيك بالاي شبكه ارتباطي ايجاد ميشود، تدابير واكنشي متعددي انديشيده شده است. در ارتباطاتي كه به صورت متقابل (interactive) هستند، بستههاي صدايي كه خراب ميشوند دوباره ارسال نميشوند. اين كار باعث افت كيفيت صدا ميشود در حالي كه تاخير را نامحسوس ميسازد. بنابراين در اين گونه ارتباطات به طور معمول از پروتكل UDP در لايه ارسال استفاده ميشود. در حالي ارسال صدا به صورت offlineانجام گيرد، اين بستهها دوباره ارسال ميشوند تا بهترين كيفيت ممكن حاصل شود. در اين موارد پروتكل TCP در لايه ارسال بهترين انتخاب است.
اصلاح خطا به صورت FEC (Forward Error Correction) يكي ديگر از تدابيري است كه در هنگام خرابي بستهها و براي جلوگيري از تاخير صدا و افت كيفيت آن انديشيده ميشود. به اين ترتيب، وسيله دريافت كننده صدا داراي اين قابليت است كه در صورت خرابي بستهها، آنها را اصلاح و بازسازي كند. اين كار كه هزينه سختافزاري بالاتري ميطلبد و نياز به اطلاعات جانبي و مكملي دارد كه كار شناسايي و اصلاح خطا را ميسر ميسازد. اين اطلاعات در همان بسته VOIP جاي ميگيرند و البته حجم بسته و ترافيك شبكه را افزايش مي دهند!
شناسايي صدا (Voice Activity Detection كه از صورت مخفف آن به نام VAD استفاده مي شود) و به دنبال آن، شلوغي آرامش بخش (Comfort Noise) از ديگر تدابير هوشمندانه در زمينه كاهش ترافيك شبكه هستند:
در سيستمهاي معمولي تلفني و از جمله VOIP همواره از هر يك از دو دستگاه برقرار كننده ارتباط كار نمونهبرداري صدا و ارسال انجام ميشود، حال چه كسي در حال صحبت كردن باشد و يا نباشد. در نظر داشته باشيد كه در يك مكالمه معمولي تلفني در هر زمان تنها يكي از طرفين در حال صحبت هستند و فرد ديگر در حال شنيدن است. به علاوه زمان نهايي نيز وجود دارد كه هيچ يك از طرفين صحبت نميكنند و براي مثال به موضوع خاصي فكر ميكنند. حال اگر بتوانيم كاري كنيم كه هر يك از دو دستگاه ارسال كننده صدا تنها زماني اقدام به اين كار كنند كه صدايي با ارزش در محيط وجود داشته باشد، به مقدار زيادي ترافيك شبكه را كاهش دادهايم. همين ايدهي ساده در بسياري از گوشيهايVOIP موجب اضافهشدن وسيلهاي به نام VAD (Voice Activity Detector) شده است. كار اين وسيله تشخيص صدا در محيط و تعيين فرستادن يا نفرستادن آن است.
با به كار گيري VAD در گوشيهاي VOIP اين مشكل پيش آمد كه همواره فرد مقابل كه در زماني هيچ گونه صدايي را نميشنيد احساس كند كه مكالمه قطع شده است. به منظور رفع چنين مشكلاتي يك تدبير هوشمندانه ديگر انديشيده شد كه به شلوغي آرامش بخش معروف است. با استفاده از اين تكنيك، همواره در صورت ارسال نشدن صدا از فرستنده، صدايي شبيه به برفك (به صورت آن چه معمولا در هنگام مكالمه تلفني شنيده ميشود) در گوشي دريافت كننده شنيده ميشود كه او از ادامه برقراري ارتباط مطلع مي سازد.