شبکه خودرمزنگار متغیر (variational autoencoder) چیست؟
درک خودرمزنگارهای متغیر (VAEs) از دو منظر:
یادگیری عمیق و مدلهای گرافیکی. چرا محققان یادگیری عمیق و افراد احتمالی یادگیری ماشین هنگام بحث در مورد رمزگذارهای خودکار متغیر گیج میشوند؟ رمزگذار خودکار متغیر چیست؟ چرا در مورد این اصطلاح سردرگمی غیر منطقی وجود دارد؟
یک شکاف مفهومی و زبانی وجود دارد. علوم شبکه های عصبی و مدل های احتمال زبان مشترکی ندارند. هدف من این است که این شکاف ایده را پر کنم و امکان همکاری و بحث بیشتر بین این زمینه ها را فراهم کنم و یک پیاده سازی ثابت را ارائه دهم (https://github.com/altosaar/variational-autoencoder).
رمزگذارهای خودکار متغیر
رمزگذارهای خودکار متغیر جالب هستند. آنها به ما اجازه میدهند مدلهای مولد پیچیدهای از دادهها را طراحی کنیم و آنها را در مجموعه دادههای بزرگ قرار دهیم. آنها می توانند تصاویری از چهره های تخیلی افراد مشهور و آثار هنری دیجیتال با وضوح بالا تولید کنند. این مدلها همچنین نتایج پیشرفتهای را در یادگیری ماشینی در تولید تصویر و یادگیری تقویتی ارائه میدهند. رمزگذارهای خودکار متغیر (VAEs) در سال 2013 توسط Kingma و همکاران تعریف شدند.
چگونه می توانیم زبانی برای بحث در مورد رمزگذارهای خودکار متغیر ایجاد کنیم؟ بیایید ابتدا با استفاده از شبکه های عصبی، سپس با استفاده از استنتاج تغییرات در مدل های احتمال، در مورد آنها فکر کنیم.
چشم انداز شبکه عصبی در زبان شبکه عصبی، رمزگذار خودکار متغیر از یک رمزگذار، یک رمزگشا و یک تابع از هزینه تشکیل شده است.
شبکه عصبی رمزگذار
ورودی آن یک نقطه داده x، خروجی آن یک نمایش پنهان z، و دارای وزن و بایاس θ است. برای مشخص بودن، فرض کنید x یک عکس 28 در 28 پیکسلی از یک عدد دست نویس است. رمزگذار داده های 784784 بعدی را در یک فضای نمایش پنهان (پنهان) z که بسیار کمتر از ابعاد 784784 است، رمزگذاری می کند.
دیدگاهتان را بنویسید