تجزیه و تحلیل استفاده از پهنای باند حافظه بافت، تحلیل استفاده از پهنای باند حافظه بافت، تجزیه و تحلیل استفاده از پهنای باند حافظه بافت، تجزیه و تحلیل استفاده از پهنای باند حافظه بافت

پهنای باند حافظه داده های بافت می تواند یک گلوگاه بالقوه برای عملکرد GPU برنامه شما باشد. تعدادی شمارنده در نمایه سیستم AGI وجود دارد که می تواند به تشخیص مشکلات پهنای باند حافظه بافت کمک کند.

کانترهای کوالکام آدرنو

در دستگاه های دارای پردازنده گرافیکی Qualcomm Adreno، برخی از شمارنده های قابل توجه عبارتند از:

شمارنده توضیحات
حافظه بافت خواندنی BW (بایت/ثانیه) پهنای باند داده بافت خوانده شده از حافظه خارجی.
٪ بافت L1 خانم حافظه نهان L1 از واکشی بافت ها حذف می شود.
% بافت های سطح غیر پایه درصد واکشی بافت که mipmap هستند.
% ناهمسانگرد فیلتر شده درصد تکسل هایی که به صورت ناهمسانگرد فیلتر شده اند.

ARM مالی شمارنده

در دستگاه های دارای پردازنده گرافیکی ARM Mali، برخی از شمارنده های قابل توجه عبارتند از:

شمارنده توضیحات
بافت خواندن ضربان از حافظه خارجی ضربان داده که توسط واحد بافت از حافظه خارجی خوانده می شود، به طور میانگین بر روی هسته های سایه زن.
ضربان خواندن بافت از حافظه نهان L2 ضربان داده که از حافظه نهان L2 توسط واحد بافت خوانده می شود، به طور میانگین بر روی هسته های سایه زن.
[بیشتر]

برای محاسبه پهنای باند کلی از ضربات متوسط ​​خوانده شده، مقدار شمارنده در عرض گذرگاه (معمولاً 16 بایت) و تعداد کل هسته های سایه زن ضرب می شود.

تجزیه و تحلیل ضد

برای اندازه‌گیری رفتار این شمارنده‌ها، میانگین و حداکثر پهنای باند را در طول یک فریم واحد پردازشگر گرافیکی اندازه‌گیری کنید، و سپس با یک بلوک پیوسته از GPU Utilization ترسیم کنید.

پهنای باند خواندن حافظه بافت برای یک فریم، با مقدار متوسط ​​565 مگابایت در ثانیه و حداکثر مقدار 2.30 گیگابایت در ثانیه
شکل 1. پهنای باند خواندن حافظه بافت برای یک فریم، با مقدار متوسط ​​565 مگابایت در ثانیه و مقدار پیک 2.30 گیگابایت در ثانیه

توصیه می کنیم پهنای باند خواندن حافظه بافتی متوسط ​​از 1 گیگابایت در ثانیه و حداکثر پهنای باند بالاتر از 3 گیگابایت در ثانیه نباشد. بافت کش L1 نیز نباید بیشتر از 10 درصد باشد. مقادیر بالاتر برای پهنای باند یا حافظه نهان L1 ممکن است نشانگر مشکلات بافت عمیق تر باشد، از جمله:

  • بافت‌ها خیلی بزرگ هستند : بافت‌های بزرگ اندازه بسته شما را متورم می‌کنند و گران‌تر هستند و ممکن است کارایی حافظه پنهان را کاهش دهند.
  • بافت‌ها فشرده نیستند : همه تلفن‌های Android از برخی از انواع فشرده‌سازی بافت پشتیبانی می‌کنند، خواه ETC1 یا ASTC. بافت ها باید فشرده شوند تا اندازه بسته بندی کاهش یابد و پهنای باند بافت کاهش یابد.
  • سایر موارد : انواع دیگر نگرانی‌های بافت را باید در نظر گرفت، از جمله بافت‌های قدرت ۲، نقشه‌برداری mip، فیلتر ناهمسانگرد و موارد دیگر. برخی از این موارد ممکن است از نمایه سیستم همانطور که در زیر بحث شده است مشاهده شوند، در حالی که برخی دیگر ممکن است نیاز به بررسی عمیق‌تری داشته باشند.

برای بازی‌های سه‌بعدی با دوربین رایگان، دارایی‌های بافت باید از mipmapping استفاده کنند، به طوری که اشیاء در فاصله از دوربین پهنای باند حافظه کاهش یافته، کارایی کش بافت بهتر و کیفیت تصویر بهتری داشته باشند. برای دستگاه‌هایی که از پردازنده‌های گرافیکی Qualcomm Adreno استفاده می‌کنند، درصد شمارنده‌های Non-Base Level Textures به‌طور متوسط ​​کمتر از 10 درصد ممکن است نشان‌دهنده نقشه‌برداری ناکافی باشد.

بافت های سطح غیر پایه برای یک فریم، با مقدار متوسط ​​9.2٪
شکل 2. بافت های سطح غیر پایه برای یک قاب، با مقدار متوسط ​​9.2٪

ملاحظات دیگر استفاده از فیلتر ناهمسانگرد است که توسط شمارنده %Anisotropic Filtered برای پردازنده‌های گرافیکی Qualcomm Adreno برای نسبت تکسل‌هایی که فیلتر ناهمسانگرد هستند توضیح داده شده است. در حالی که این ممکن است کیفیت بصری را برای برخی از بازی ها بهبود بخشد، اما می تواند بسیار گران باشد و استفاده از آن باید با هزینه عملکرد GPU سنجیده شود.

درصد ناهمسانگرد فیلتر شده برای یک فریم، با مقدار متوسط ​​10.8٪
شکل 3. درصد ناهمسانگرد فیلتر شده برای یک فریم، با مقدار متوسط ​​10.8٪

بهترین راه برای تشخیص مشکلات خاص تر، استفاده از ردیابی نمایه قاب برای تجزیه و تحلیل دارایی های بافت است.

،

پهنای باند حافظه داده های بافت می تواند یک گلوگاه بالقوه برای عملکرد GPU برنامه شما باشد. تعدادی شمارنده در نمایه سیستم AGI وجود دارد که می تواند به تشخیص مشکلات پهنای باند حافظه بافت کمک کند.

کانترهای کوالکام آدرنو

در دستگاه های دارای پردازنده گرافیکی Qualcomm Adreno، برخی از شمارنده های قابل توجه عبارتند از:

شمارنده توضیحات
حافظه بافت خواندنی BW (بایت/ثانیه) پهنای باند داده بافت خوانده شده از حافظه خارجی.
٪ بافت L1 خانم حافظه نهان L1 از واکشی بافت ها حذف می شود.
% بافت های سطح غیر پایه درصد واکشی بافت که mipmap هستند.
% ناهمسانگرد فیلتر شده درصد تکسل هایی که به صورت ناهمسانگرد فیلتر شده اند.

ARM مالی شمارنده

در دستگاه های دارای پردازنده گرافیکی ARM Mali، برخی از شمارنده های قابل توجه عبارتند از:

شمارنده توضیحات
بافت خواندن ضربات از حافظه خارجی ضربان داده که توسط واحد بافت از حافظه خارجی خوانده می شود، به طور میانگین بر روی هسته های سایه زن.
ضربان خواندن بافت از حافظه نهان L2 ضربان داده که از حافظه نهان L2 توسط واحد بافت خوانده می شود، به طور میانگین بر روی هسته های سایه زن.
[بیشتر]

برای محاسبه پهنای باند کلی از ضربات متوسط ​​خوانده شده، مقدار شمارنده در عرض گذرگاه (معمولاً 16 بایت) و تعداد کل هسته های سایه زن ضرب می شود.

تجزیه و تحلیل ضد

برای اندازه‌گیری رفتار این شمارنده‌ها، میانگین و حداکثر پهنای باند را در طول یک فریم واحد پردازشگر گرافیکی اندازه‌گیری کنید، و سپس با یک بلوک پیوسته از GPU Utilization ترسیم کنید.

پهنای باند خواندن حافظه بافت برای یک فریم، با مقدار متوسط ​​565 مگابایت در ثانیه و حداکثر مقدار 2.30 گیگابایت در ثانیه
شکل 1. پهنای باند خواندن حافظه بافت برای یک فریم، با مقدار متوسط ​​565 مگابایت در ثانیه و مقدار پیک 2.30 گیگابایت در ثانیه

توصیه می کنیم پهنای باند خواندن حافظه بافتی متوسط ​​از 1 گیگابایت در ثانیه و حداکثر پهنای باند بالاتر از 3 گیگابایت در ثانیه نباشد. بافت کش L1 نیز نباید بیشتر از 10 درصد باشد. مقادیر بالاتر برای پهنای باند یا حافظه نهان L1 ممکن است نشانگر مشکلات بافت عمیق تر باشد، از جمله:

  • بافت‌ها خیلی بزرگ هستند : بافت‌های بزرگ اندازه بسته شما را متورم می‌کنند و گران‌تر هستند و ممکن است کارایی حافظه پنهان را کاهش دهند.
  • بافت‌ها فشرده نیستند : همه تلفن‌های Android از برخی از انواع فشرده‌سازی بافت پشتیبانی می‌کنند، خواه ETC1 یا ASTC. بافت ها باید فشرده شوند تا اندازه بسته بندی کاهش یابد و پهنای باند بافت کاهش یابد.
  • سایر موارد : انواع دیگر نگرانی‌های بافت را باید در نظر گرفت، از جمله بافت‌های قدرت ۲، نقشه‌برداری mip، فیلتر ناهمسانگرد و موارد دیگر. برخی از این موارد ممکن است از نمایه سیستم همانطور که در زیر بحث شده است مشاهده شوند، در حالی که برخی دیگر ممکن است نیاز به بررسی عمیق‌تری داشته باشند.

برای بازی‌های سه‌بعدی با دوربین رایگان، دارایی‌های بافت باید از mipmapping استفاده کنند، به طوری که اشیاء در فاصله از دوربین پهنای باند حافظه کاهش یافته، کارایی کش بافت بهتر و کیفیت تصویر بهتری داشته باشند. برای دستگاه‌هایی که از پردازنده‌های گرافیکی Qualcomm Adreno استفاده می‌کنند، درصد شمارنده‌های Non-Base Level Textures به‌طور متوسط ​​کمتر از 10 درصد ممکن است نشان‌دهنده نقشه‌برداری ناکافی باشد.

بافت های سطح غیر پایه برای یک فریم، با مقدار متوسط ​​9.2٪
شکل 2. بافت های سطح غیر پایه برای یک قاب، با مقدار متوسط ​​9.2٪

ملاحظات دیگر استفاده از فیلتر ناهمسانگرد است که توسط شمارنده %Anisotropic Filtered برای پردازنده‌های گرافیکی Qualcomm Adreno برای نسبت تکسل‌هایی که فیلتر ناهمسانگرد هستند توضیح داده شده است. در حالی که این ممکن است کیفیت بصری را برای برخی از بازی ها بهبود بخشد، اما می تواند بسیار گران باشد و استفاده از آن باید با هزینه عملکرد GPU سنجیده شود.

درصد ناهمسانگرد فیلتر شده برای یک فریم، با مقدار متوسط ​​10.8٪
شکل 3. درصد ناهمسانگرد فیلتر شده برای یک فریم، با مقدار متوسط ​​10.8٪

بهترین راه برای تشخیص مشکلات خاص تر، استفاده از ردیابی نمایه قاب برای تجزیه و تحلیل دارایی های بافت است.

،

پهنای باند حافظه داده های بافت می تواند یک گلوگاه بالقوه برای عملکرد GPU برنامه شما باشد. تعدادی شمارنده در نمایه سیستم AGI وجود دارد که می تواند به تشخیص مشکلات پهنای باند حافظه بافت کمک کند.

کانترهای کوالکام آدرنو

در دستگاه های دارای پردازنده گرافیکی Qualcomm Adreno، برخی از شمارنده های قابل توجه عبارتند از:

شمارنده توضیحات
حافظه بافت خواندنی BW (بایت/ثانیه) پهنای باند داده بافت خوانده شده از حافظه خارجی.
٪ بافت L1 خانم حافظه نهان L1 از واکشی بافت ها حذف می شود.
% بافت های سطح غیر پایه درصد واکشی بافت که mipmap هستند.
% ناهمسانگرد فیلتر شده درصد تکسل هایی که به صورت ناهمسانگرد فیلتر شده اند.

ARM مالی شمارنده

در دستگاه های دارای پردازنده گرافیکی ARM Mali، برخی از شمارنده های قابل توجه عبارتند از:

شمارنده توضیحات
بافت خواندن ضربان از حافظه خارجی ضربان داده که توسط واحد بافت از حافظه خارجی خوانده می شود، به طور میانگین بر روی هسته های سایه زن.
ضربان خواندن بافت از حافظه نهان L2 ضربان داده که از حافظه نهان L2 توسط واحد بافت خوانده می شود، به طور میانگین بر روی هسته های سایه زن.
[بیشتر]

برای محاسبه پهنای باند کلی از ضربات متوسط ​​خوانده شده، مقدار شمارنده در عرض گذرگاه (معمولاً 16 بایت) و تعداد کل هسته های سایه زن ضرب می شود.

تحلیل ضد

برای اندازه‌گیری رفتار این شمارنده‌ها، میانگین و حداکثر پهنای باند را در طول یک فریم واحد پردازشگر گرافیکی اندازه‌گیری کنید، و سپس با یک بلوک پیوسته از GPU Utilization ترسیم کنید.

پهنای باند خواندن حافظه بافت برای یک فریم، با مقدار متوسط ​​565 مگابایت در ثانیه و حداکثر مقدار 2.30 گیگابایت در ثانیه
شکل 1. پهنای باند خواندن حافظه بافت برای یک فریم، با مقدار متوسط ​​565 مگابایت در ثانیه و مقدار پیک 2.30 گیگابایت در ثانیه

توصیه می کنیم پهنای باند خواندن حافظه بافتی متوسط ​​از 1 گیگابایت در ثانیه و حداکثر پهنای باند بالاتر از 3 گیگابایت در ثانیه نباشد. بافت کش L1 نیز نباید بیشتر از 10 درصد باشد. مقادیر بالاتر برای پهنای باند یا حافظه نهان L1 ممکن است نشانگر مشکلات بافت عمیق تر باشد، از جمله:

  • بافت‌ها خیلی بزرگ هستند : بافت‌های بزرگ اندازه بسته شما را متورم می‌کنند و گران‌تر هستند و ممکن است کارایی حافظه پنهان را کاهش دهند.
  • بافت‌ها فشرده نشده‌اند : همه تلفن‌های اندرویدی از انواع فشرده‌سازی بافت پشتیبانی می‌کنند، خواه ETC1 یا ASTC. بافت ها باید فشرده شوند تا اندازه بسته بندی کاهش یابد و پهنای باند بافت کاهش یابد.
  • سایر موارد : انواع دیگر نگرانی‌های بافت را باید در نظر گرفت، از جمله بافت‌های قدرت ۲، نقشه‌برداری mip، فیلتر ناهمسانگرد و موارد دیگر. برخی از این موارد ممکن است از نمایه سیستم همانطور که در زیر بحث شده است مشاهده شوند، در حالی که برخی دیگر ممکن است نیاز به بررسی عمیق‌تری داشته باشند.

برای بازی‌های سه‌بعدی با دوربین رایگان، دارایی‌های بافت باید از mipmapping استفاده کنند، به طوری که اشیاء در فاصله از دوربین پهنای باند حافظه کاهش یافته، کارایی کش بافت بهتر و کیفیت تصویر بهتری داشته باشند. برای دستگاه‌هایی که از پردازنده‌های گرافیکی Qualcomm Adreno استفاده می‌کنند، درصد شمارنده‌های Non-Base Level Textures به‌طور متوسط ​​کمتر از 10 درصد ممکن است نشان‌دهنده نقشه‌برداری ناکافی باشد.

بافت های سطح غیر پایه برای یک فریم، با مقدار متوسط ​​9.2٪
شکل 2. بافت های سطح غیر پایه برای یک قاب، با مقدار متوسط ​​9.2٪

ملاحظات دیگر استفاده از فیلتر ناهمسانگرد است که توسط شمارنده %Anisotropic Filtered برای پردازنده‌های گرافیکی Qualcomm Adreno برای نسبت تکسل‌هایی که فیلتر ناهمسانگرد هستند توضیح داده شده است. در حالی که این ممکن است کیفیت بصری را برای برخی از بازی ها بهبود بخشد، اما می تواند بسیار گران باشد و استفاده از آن باید با هزینه عملکرد GPU سنجیده شود.

درصد ناهمسانگرد فیلتر شده برای یک فریم، با مقدار متوسط ​​10.8٪
شکل 3. درصد ناهمسانگرد فیلتر شده برای یک فریم، با مقدار متوسط ​​10.8٪

بهترین راه برای تشخیص مشکلات خاص تر، استفاده از ردیابی نمایه قاب برای تجزیه و تحلیل دارایی های بافت است.

،

پهنای باند حافظه داده های بافت می تواند یک گلوگاه بالقوه برای عملکرد GPU برنامه شما باشد. تعدادی شمارنده در نمایه سیستم AGI وجود دارد که می تواند به تشخیص مشکلات پهنای باند حافظه بافت کمک کند.

کانترهای کوالکام آدرنو

در دستگاه های دارای پردازنده گرافیکی Qualcomm Adreno، برخی از شمارنده های قابل توجه عبارتند از:

شمارنده توضیحات
حافظه بافت خواندنی BW (بایت/ثانیه) پهنای باند داده بافت خوانده شده از حافظه خارجی.
٪ بافت L1 خانم حافظه نهان L1 از واکشی بافت ها حذف می شود.
% بافت های سطح غیر پایه درصد واکشی بافت که mipmap هستند.
% ناهمسانگرد فیلتر شده درصد تکسل هایی که به صورت ناهمسانگرد فیلتر شده اند.

ARM مالی شمارنده

در دستگاه های دارای پردازنده گرافیکی ARM Mali، برخی از شمارنده های قابل توجه عبارتند از:

شمارنده توضیحات
بافت خواندن ضربات از حافظه خارجی ضربان داده که توسط واحد بافت از حافظه خارجی خوانده می شود، به طور میانگین بر روی هسته های سایه زن.
ضربان خواندن بافت از حافظه نهان L2 ضربان داده که از حافظه نهان L2 توسط واحد بافت خوانده می شود، به طور میانگین بر روی هسته های سایه زن.
[بیشتر]

برای محاسبه پهنای باند کلی از ضربات متوسط ​​خوانده شده، مقدار شمارنده در عرض گذرگاه (معمولاً 16 بایت) و تعداد کل هسته های سایه زن ضرب می شود.

تجزیه و تحلیل ضد

برای اندازه‌گیری رفتار این شمارنده‌ها، میانگین و حداکثر پهنای باند را در طول یک فریم واحد پردازشگر گرافیکی اندازه‌گیری کنید، و سپس با یک بلوک پیوسته از GPU Utilization ترسیم کنید.

پهنای باند خواندن حافظه بافت برای یک فریم، با مقدار متوسط ​​565 مگابایت در ثانیه و حداکثر مقدار 2.30 گیگابایت در ثانیه
شکل 1. پهنای باند خواندن حافظه بافت برای یک فریم، با مقدار متوسط ​​565 مگابایت در ثانیه و مقدار پیک 2.30 گیگابایت در ثانیه

توصیه می کنیم پهنای باند خواندن حافظه بافتی متوسط ​​از 1 گیگابایت در ثانیه و حداکثر پهنای باند بالاتر از 3 گیگابایت در ثانیه نباشد. بافت کش L1 نیز نباید بیشتر از 10 درصد باشد. مقادیر بالاتر برای پهنای باند یا حافظه نهان L1 ممکن است نشانگر مشکلات بافت عمیق تر باشد، از جمله:

  • بافت‌ها خیلی بزرگ هستند : بافت‌های بزرگ اندازه بسته شما را متورم می‌کنند و گران‌تر هستند و ممکن است کارایی حافظه پنهان را کاهش دهند.
  • بافت‌ها فشرده نیستند : همه تلفن‌های Android از برخی از انواع فشرده‌سازی بافت پشتیبانی می‌کنند، خواه ETC1 یا ASTC. بافت ها باید فشرده شوند تا اندازه بسته بندی کاهش یابد و پهنای باند بافت کاهش یابد.
  • سایر موارد : انواع دیگر نگرانی‌های بافت را باید در نظر گرفت، از جمله بافت‌های قدرت ۲، نقشه‌برداری mip، فیلتر ناهمسانگرد و موارد دیگر. برخی از این موارد ممکن است از نمایه سیستم همانطور که در زیر بحث شده است مشاهده شوند، در حالی که برخی دیگر ممکن است نیاز به بررسی عمیق‌تری داشته باشند.

برای بازی‌های سه‌بعدی با دوربین رایگان، دارایی‌های بافت باید از mipmapping استفاده کنند، به طوری که اشیاء در فاصله از دوربین پهنای باند حافظه کاهش یافته، کارایی کش بافت بهتر و کیفیت تصویر بهتری داشته باشند. برای دستگاه‌هایی که از پردازنده‌های گرافیکی Qualcomm Adreno استفاده می‌کنند، درصد شمارنده‌های Non-Base Level Textures به‌طور متوسط ​​کمتر از 10 درصد ممکن است نشان‌دهنده نقشه‌برداری ناکافی باشد.

بافت های سطح غیر پایه برای یک فریم، با مقدار متوسط ​​9.2٪
شکل 2. بافت های سطح غیر پایه برای یک قاب، با مقدار متوسط ​​9.2٪

ملاحظات دیگر استفاده از فیلتر ناهمسانگرد است که توسط شمارنده %Anisotropic Filtered برای پردازنده‌های گرافیکی Qualcomm Adreno برای نسبت تکسل‌هایی که فیلتر ناهمسانگرد هستند توضیح داده شده است. در حالی که این ممکن است کیفیت بصری را برای برخی از بازی ها بهبود بخشد، اما می تواند بسیار گران باشد و استفاده از آن باید با هزینه عملکرد GPU سنجیده شود.

درصد ناهمسانگرد فیلتر شده برای یک فریم، با مقدار متوسط ​​10.8٪
شکل 3. درصد ناهمسانگرد فیلتر شده برای یک فریم، با مقدار متوسط ​​10.8٪

بهترین راه برای تشخیص مشکلات خاص تر، استفاده از ردیابی نمایه قاب برای تجزیه و تحلیل دارایی های بافت است.