هشدار: OpenSL ES منسوخ شده است. توسعه دهندگان باید از کتابخانه منبع باز Oboe استفاده کنند که در GitHub در دسترس است. Oboe یک بسته بندی C++ است که یک API ارائه می دهد که بسیار شبیه به AAudio است. زمانی که AAudio در دسترس باشد Oboe با AAudio تماس می گیرد و اگر AAudio در دسترس نباشد به OpenSL ES برمی گردد.
OpenSL ES برای Android مشخصات OpenSL ES مرجع را گسترش می دهد تا با Android سازگار باشد و از قدرت و انعطاف پذیری پلت فرم اندروید بهره مند شود.
تعریف API برای برنامههای افزودنی Android در OpenSLES_Android.h
و فایلهای سرصفحهای که شامل میشود قرار دارد. برای جزئیات بیشتر در مورد این افزونه ها با OpenSLES_Android.h
مشورت کنید. این فایل در زیر ریشه نصب شما، در پوشه sysroot/usr/include/SLES
قرار دارد. مگر اینکه غیر از این ذکر شده باشد، همه رابط ها صریح هستند.
این افزونهها قابلیت حمل برنامه شما را به سایر پیادهسازیهای OpenSL ES محدود میکنند، زیرا آنها مختص اندروید هستند. می توانید با اجتناب از استفاده از افزونه ها یا با استفاده از #ifdef
برای حذف آنها در زمان کامپایل، این مشکل را کاهش دهید.
جدول زیر رابط های خاص اندروید و مکان یاب داده را نشان می دهد که Android OpenSL ES برای هر نوع شی پشتیبانی می کند. مقادیر Yes در سلول ها رابط ها و مکان یاب داده ای را نشان می دهد که برای هر نوع شی در دسترس است.
ویژگی | پخش کننده صدا | ضبط کننده صدا | موتور | ترکیب خروجی |
---|---|---|---|---|
صف بافر اندروید | بله: منبع (رمزگشایی) | خیر | خیر | خیر |
پیکربندی اندروید | بله | بله | خیر | خیر |
افکت اندروید | بله | خیر | خیر | بله |
قابلیت افکت اندروید | خیر | خیر | بله | خیر |
ارسال افکت اندروید | بله | خیر | خیر | خیر |
صف بافر ساده اندروید | بله: منبع (پخش) یا سینک (رمزگشایی) | بله | خیر | خیر |
مکان یاب داده صف بافر اندروید | بله: منبع (رمزگشایی) | خیر | خیر | خیر |
مکان یاب داده توصیفگر فایل اندروید | بله: منبع | خیر | خیر | خیر |
یاب داده صف بافر ساده اندروید | بله: منبع (پخش) یا سینک (رمزگشایی) | بله: سینک | خیر | خیر |
رابط پیکربندی اندروید
رابط پیکربندی Android وسیله ای برای تنظیم پارامترهای پلتفرم خاص برای اشیا فراهم می کند. این رابط با دیگر رابطهای OpenSL ES 1.0.1 متفاوت است زیرا برنامه شما میتواند قبل از نمونهسازی شی مربوطه از آن استفاده کند. بنابراین، می توانید قبل از نمونه سازی شی، آن را پیکربندی کنید. فایل سرصفحه OpenSLES_AndroidConfiguration.h
که در /sysroot/usr/include/SLES
قرار دارد، کلیدهای پیکربندی موجود و مقادیر زیر را مستند میکند:
- نوع جریان برای پخشکنندههای صوتی (پیشفرض
SL_ANDROID_STREAM_MEDIA
). - نمایه ضبط برای ضبط کننده های صوتی (پیش فرض
SL_ANDROID_RECORDING_PRESET_GENERIC
).
قطعه کد زیر نمونه ای از نحوه تنظیم نوع جریان صوتی اندروید را در پخش کننده صوتی نشان می دهد:
// CreateAudioPlayer and specify SL_IID_ANDROIDCONFIGURATION // in the required interface ID array. Do not realize player yet. // ... SLAndroidConfigurationItf playerConfig; result = (*playerObject)->GetInterface(playerObject, SL_IID_ANDROIDCONFIGURATION, &playerConfig); assert(SL_RESULT_SUCCESS == result); SLint32 streamType = SL_ANDROID_STREAM_ALARM; result = (*playerConfig)->SetConfiguration(playerConfig, SL_ANDROID_KEY_STREAM_TYPE, &streamType, sizeof(SLint32)); assert(SL_RESULT_SUCCESS == result); // ... // Now realize the player here.
میتوانید از کد مشابهی برای پیکربندی پیشتنظیم ضبطکننده صدا استفاده کنید:
// ... obtain the configuration interface as the first four lines above, then: SLuint32 presetValue = SL_ANDROID_RECORDING_PRESET_VOICE_RECOGNITION; result = (*playerConfig)->SetConfiguration(playerConfig, RECORDING_PRESET, &presetValue, sizeof(SLuint32));
رابط های افکت اندروید
رابطهای قابلیتهای افکت، ارسال افکت و افکت اندروید مکانیزمی کلی برای درخواست و استفاده از جلوههای صوتی خاص دستگاه برای یک برنامه فراهم میکنند. سازندگان دستگاه باید جلوههای صوتی خاص دستگاه را که ارائه میکنند مستند کنند.
برنامههای قابل حمل باید از APIهای OpenSL ES 1.0.1 برای جلوههای صوتی به جای برنامههای افزودنی افکت Android استفاده کنند.
مکان یاب داده توصیفگر فایل اندروید
مکان یاب داده توصیفگر فایل Android به شما امکان می دهد منبع یک پخش کننده صوتی را به عنوان یک توصیف کننده فایل باز با دسترسی خواندن مشخص کنید. فرمت داده باید MIME باشد.
این برنامه افزودنی به ویژه در ارتباط با مدیر دارایی بومی مفید است، زیرا برنامه دارایی ها را از APK از طریق یک توصیفگر فایل می خواند.
یاب و رابط داده صف بافر ساده اندروید
در مشخصات مرجع OpenSL ES 1.0.1، صف های بافر فقط برای پخش کننده های صوتی قابل استفاده هستند و با PCM و سایر فرمت های داده سازگار هستند. مشخصات یاب داده صف بافر ساده اندروید و مشخصات رابط با مشخصات مرجع یکسان است، با دو استثنا:
- می توانید از صف های بافر ساده اندروید با ضبط کننده های صوتی و پخش کننده های صوتی استفاده کنید.
- شما فقط می توانید از فرمت داده PCM با این صف ها استفاده کنید.
برای ضبط، برنامه شما باید بافرهای خالی را در صف قرار دهد. هنگامی که یک تماس برگشتی ثبتشده اعلانی مبنی بر اینکه سیستم نوشتن دادهها را در بافر تمام کرده است ارسال میکند، برنامه میتواند از آن بافر بخواند.
پخش به همین صورت عمل می کند. با این حال، برای سازگاری کد منبع در آینده، پیشنهاد میکنیم که برنامهها از صفهای بافر ساده Android به جای صفهای بافر OpenSL ES 1.0.1 استفاده کنند.
رفتار صف بافر
اجرای Android شامل الزامات مشخصات مرجع نیست که نشانگر پخش به ابتدای بافر در حال پخش فعلی بازگردد، زمانی که پخش وارد حالت SL_PLAYSTATE_STOPPED
شد. این پیادهسازی میتواند با آن رفتار مطابقت داشته باشد، یا میتواند مکان مکاننمای بازی را بدون تغییر باقی بگذارد. در نتیجه، برنامه شما نمی تواند فرض کند که هر یک از این رفتارها رخ می دهد. بنابراین، شما باید به صراحت BufferQueue::Clear()
پس از انتقال به SL_PLAYSTATE_STOPPED
فراخوانی کنید. با انجام این کار، صف بافر در حالت شناخته شده قرار می گیرد.
به طور مشابه، هیچ مشخصه ای وجود ندارد که نشان دهد ماشه برای پاسخ به تماس صف بافر باید انتقال به SL_PLAYSTATE_STOPPED
یا اجرای BufferQueue::Clear()
باشد. بنابراین، توصیه می کنیم که وابستگی به یکی یا دیگری ایجاد نکنید. در عوض، برنامه شما باید بتواند هر دو را مدیریت کند.
رابط های پویا در ایجاد شی
برای راحتی، پیادهسازی Android OpenSL ES 1.0.1 به برنامه شما اجازه میدهد تا هنگامی که یک شی را نمونهسازی میکند، رابطهای پویا را مشخص کند. این جایگزینی برای استفاده از DynamicInterfaceManagement::AddInterface()
برای افزودن این رابط ها پس از نمونه سازی است.
گزارش برنامه های افزودنی
سه روش برای پرس و جو وجود دارد که آیا پلتفرم از برنامه های افزودنی اندروید پشتیبانی می کند یا خیر. این روش ها عبارتند از:
-
Engine::QueryNumSupportedExtensions()
-
Engine::QuerySupportedExtension()
-
Engine::IsExtensionSupported()
هر یک از این روشها ANDROID_SDK_LEVEL_<API-level>
را برمیگرداند، که در آن API-level
سطح API پلتفرم است. برای مثال، ANDROID_SDK_LEVEL_23
. سطح API پلتفرم 9 یا بالاتر به این معنی است که پلتفرم از برنامههای افزودنی پشتیبانی میکند.
رمزگشایی صدا به PCM
این بخش یک برنامه افزودنی خاص Android منسوخ شده برای OpenSL ES 1.0.1 را برای رمزگشایی یک جریان رمزگذاری شده به PCM بدون پخش فوری توضیح می دهد. جدول زیر توصیه هایی را برای استفاده از این افزونه و جایگزین ها ارائه می دهد.
سطح API | جایگزین ها |
---|---|
15 و پایین تر | یک کدک منبع باز با مجوز مناسب |
16 تا 20 | کلاس MediaCodec یا یک کدک منبع باز با مجوز مناسب |
21 و بالاتر | NDK MediaCodec در فایلهای هدر <media/NdkMedia*.h> ، کلاس MediaCodec یا یک کدک منبع باز با مجوز مناسب |
توجه: در حال حاضر هیچ سندی برای نسخه NDK MediaCodec
API وجود ندارد. با این حال، می توانید برای نمونه به کد نمونه کدک داخلی مراجعه کنید.
یک پخش کننده استاندارد صوتی در دستگاه صوتی پخش می شود و ترکیب خروجی را به عنوان سینک داده مشخص می کند. برنامه افزودنی Android از این جهت متفاوت است که اگر برنامه منبع داده را به عنوان URI یا به عنوان یاب یاب داده توصیف کننده فایل Android که با استفاده از قالب داده MIME توصیف شده است، به جای آن به عنوان یک رمزگشا عمل می کند. در چنین حالتی، سینک داده یک مکان یاب داده صف بافر ساده اندروید است که از فرمت داده PCM استفاده می کند.
این ویژگی در درجه اول برای بازی ها در نظر گرفته شده است تا دارایی های صوتی خود را در هنگام تغییر به سطح بازی جدید از قبل بارگذاری کنند، که مشابه عملکردی است که کلاس SoundPool
ارائه می دهد.
برنامه ابتدا باید مجموعه ای از بافرهای خالی را در صف بافر ساده اندروید قرار دهد. پس از آن، برنامه بافرها را با داده های PCM پر می کند. پس از پر شدن هر بافر، صف برگشت بافر ساده اندروید فعال می شود. کنترل کننده تماس، داده های PCM را پردازش می کند، بافر خالی را دوباره در صف قرار می دهد و سپس برمی گرداند. برنامه مسئول پیگیری بافرهای رمزگشایی شده است. لیست پارامترهای برگشت به تماس شامل اطلاعات کافی برای نشان دادن بافری که حاوی داده یا بافری است که باید در نوبت بعدی قرار گیرد، نیست.
منبع داده به طور ضمنی پایان جریان (EOS) را با ارائه یک رویداد SL_PLAYEVENT_HEADATEND
در پایان جریان گزارش میکند. پس از اینکه برنامه تمام دادههای دریافتی خود را رمزگشایی کرد، دیگر با پاسخ به تماس صف بافر ساده اندروید تماسی برقرار نمیکند.
فرمت داده PCM سینک معمولاً با منبع داده کدگذاری شده با توجه به نرخ نمونه، تعداد کانال و عمق بیت مطابقت دارد. با این حال، میتوانید با نرخ نمونه، تعداد کانال یا عمق بیت متفاوت رمزگشایی کنید. برای اطلاعات در مورد یک ماده برای تشخیص قالب PCM واقعی، به تعیین قالب داده های PCM رمزگشایی شده از طریق ابرداده مراجعه کنید.
OpenSL ES برای ویژگی رمزگشایی PCM اندروید از مکث و جستجوی اولیه پشتیبانی می کند. از کنترل صدا، افکت ها، حلقه زدن یا نرخ پخش پشتیبانی نمی کند.
بسته به پیاده سازی پلت فرم، رمزگشایی ممکن است به منابعی نیاز داشته باشد که نمی توان آنها را بیکار گذاشت. بنابراین، توصیه می کنیم حتماً تعداد کافی بافر خالی PCM را تهیه کنید. در غیر این صورت، رمزگشا گرسنه می ماند. این ممکن است اتفاق بیفتد، به عنوان مثال، اگر برنامه شما از پاسخ تماس صف بافر ساده اندروید بدون قرار دادن بافر خالی دیگر در صف بازگردد. نتیجه گرسنگی رمزگشا نامشخص است، اما ممکن است شامل موارد زیر باشد: حذف دادههای PCM رمزگشایی، توقف فرآیند رمزگشایی، یا خاتمه کامل رمزگشا.
توجه: برای رمزگشایی یک جریان رمزگذاری شده در PCM اما عدم پخش فوری، برای برنامههایی که روی Android 4.x (سطوح API 16 تا 20) اجرا میشوند، توصیه میکنیم از کلاس MediaCodec
استفاده کنید. برای برنامههای جدید که روی Android نسخه 5.0 (سطح API 21) یا بالاتر اجرا میشوند، توصیه میکنیم از معادل NDK، <NdkMedia*.h>
استفاده کنید. این فایلهای هدر در فهرست media/
در زیر ریشه نصب شما قرار دارند.
رمزگشایی جریان ADTS AAC به PCM
اگر منبع داده یک مکان یاب داده صف بافر اندروید باشد که از فرمت داده MIME استفاده می کند، پخش کننده صوتی به عنوان رمزگشای جریان عمل می کند، و سینک داده یک مکان یاب داده صف بافر ساده اندروید است که از قالب داده PCM استفاده می کند. فرمت داده MIME را به صورت زیر پیکربندی کنید:
- ظرف:
SL_CONTAINERTYPE_RAW
- رشته نوع MIME:
SL_ANDROID_MIME_AACADTS
این ویژگی در درجه اول برای برنامه های پخش رسانه ای است که با صدای AAC سروکار دارند اما قبل از پخش باید پردازش صوتی سفارشی انجام دهند. اکثر برنامه هایی که نیاز به رمزگشایی صدا به PCM دارند باید از روشی استفاده کنند که Decode audio to PCM توضیح می دهد، زیرا این روش ساده تر است و فرمت های صوتی بیشتری را مدیریت می کند. تکنیکی که در اینجا توضیح داده شده یک رویکرد تخصصی تری است که فقط در صورت اعمال هر دو شرایط زیر قابل استفاده است:
- منبع صوتی فشرده جریانی از فریمهای AAC است که در سرفصلهای ADTS موجود است.
- برنامه این جریان را مدیریت می کند. داده ها در یک منبع شبکه که شناسه آن یک URI است یا در یک فایل محلی که شناسه آن توصیفگر فایل است، قرار ندارد .
برنامه ابتدا باید مجموعه ای از بافرهای پر شده را در صف بافر اندروید قرار دهد. هر بافر حاوی یک یا چند فریم کامل ADTS AAC است. پس از خالی شدن هر بافر، صف برگشت تماس بافر اندروید فعال می شود. کنترل کننده تماس مجدد باید بافر را دوباره پر کرده و دوباره در صف قرار دهد و سپس برگردد. برنامه نیازی به پیگیری بافرهای کدگذاری شده ندارد. لیست پارامترهای برگشتی شامل اطلاعات کافی برای نشان دادن بافری است که باید در نوبت بعدی قرار گیرد. پایان جریان به صراحت با قرار دادن یک مورد EOS در صف مشخص شده است. پس از EOS، دیگر صفبندی مجاز نیست.
توصیه می کنیم حتما بافرهای کامل ADTS AAC را تهیه کنید تا از گرسنگی رسیور جلوگیری کنید. این ممکن است اتفاق بیفتد، به عنوان مثال، اگر برنامه شما از صف بافر Android بدون قرار گرفتن در صف بافر کامل دیگر بازگردد. نتیجه گرسنگی رسیور نامشخص است.
از همه جهات به جز منبع داده، روش رمزگشایی جریانی همان روشی است که Decode audio to PCM توضیح میدهد.
با وجود شباهت در نامها، صف بافر اندروید با صف بافر ساده اندروید یکسان نیست . رمزگشای جریان از هر دو نوع صف بافر استفاده می کند: یک صف بافر اندروید برای منبع داده ADTS AAC و یک صف بافر ساده اندروید برای سینک داده PCM. برای اطلاعات بیشتر درباره API صف بافر ساده Android، به مکان یاب و رابط داده صف بافر ساده Android مراجعه کنید. برای اطلاعات بیشتر درباره API صف بافر Android، فایل index.html
را در فهرست راهنمای docs/Additional_library_docs/openmaxal/
در زیر ریشه نصب ببینید.
فرمت داده های PCM رمزگشایی شده را از طریق ابرداده تعیین کنید
رابط SLMetadataExtractionItf
بخشی از مشخصات مرجع است. با این حال، کلیدهای ابرداده که فرمت واقعی دادههای PCM رمزگشایی شده را نشان میدهند، مختص اندروید هستند. فایل هدر OpenSLES_AndroidMetadata.h
این کلیدهای فراداده را تعریف می کند. این فایل هدر در زیر ریشه نصب شما، در پوشه /sysroot/usr/include/SLES
قرار دارد.
شاخص های کلید فراداده بلافاصله پس از پایان اجرای متد Object::Realize()
در دسترس هستند. با این حال، مقادیر مرتبط تا زمانی که برنامه اولین داده های رمزگذاری شده را رمزگشایی کند، در دسترس نیستند. یک تمرین خوب این است که پس از فراخوانی Object::Realize
شاخصهای کلیدی را در رشته اصلی جستجو کنید و در هنگام فراخوانی برای اولین بار، مقادیر فراداده قالب PCM را در کنترلکننده پاسخ تماس صف بافر ساده اندروید بخوانید. برای نمونه هایی از کار با این رابط، به کد نمونه موجود در بسته NDK مراجعه کنید.
نامهای کلید فراداده پایدار هستند، اما شاخصهای کلیدی مستند نیستند و ممکن است تغییر کنند. یک برنامه نباید فرض کند که شاخصها در اجرای مختلف اجرا میشوند و نباید فرض کند که نمونههای شی چندگانه در یک اجرا شاخصها را به اشتراک میگذارند.
داده های ممیز شناور
برنامهای که بر روی Android نسخه 5.0 (سطح API 21) و بالاتر اجرا میشود، میتواند دادهها را در قالب تک دقیق و ممیز شناور به AudioPlayer ارائه دهد.
در کد مثال زیر، متد Engine::CreateAudioPlayer()
یک پخش کننده صوتی ایجاد می کند که از داده های ممیز شناور استفاده می کند:
#include <SLES/OpenSLES_Android.h> ... SLAndroidDataFormat_PCM_EX pcm; pcm.formatType = SL_ANDROID_DATAFORMAT_PCM_EX; pcm.numChannels = 2; pcm.sampleRate = SL_SAMPLINGRATE_44_1; pcm.bitsPerSample = 32; pcm.containerSize = 32; pcm.channelMask = SL_SPEAKER_FRONT_LEFT | SL_SPEAKER_FRONT_RIGHT; pcm.endianness = SL_BYTEORDER_LITTLEENDIAN; pcm.representation = SL_ANDROID_PCM_REPRESENTATION_FLOAT; ... SLDataSource audiosrc; audiosrc.pLocator = ... audiosrc.pFormat = &pcm;