تحول در تجارت بصری با مدلهای بینایی رایانه ای

تحول در تجارت بصری با مدلهای بینایی رایانه ای

شرکت هایی مانند eBay و آمازون میلیون ها تصویر از محصولات را ذخیره می کنند. هر تصویر حاوی اطلاعات زیادی است که می تواند برای کمک به مصرف کنندگان در یافتن محصول مناسب یا تبلیغ محصولات مشابه مورد استفاده قرار گیرد. با در دسترس بودن و اثربخشی مدل های بینایی رایانه ، یعنی شبکه های عصبی پیچیده ، حجم بالای اطلاعات موجود در تصاویر در حال حاضر بسیار در دسترس است. در ODSC West در سال 2018 ، رابینسون پیراموتو از Ebay تکنیک های کلیدی را برای هدایت چالش ها در ایجاد تحول در تجارت بصری با مدل های بینایی رایانه ای ارائه کرد.

[مقاله مرتبط: ترکیب میلیون ها محصول در یک بازار با استفاده از دید کامپیوتر و NLP] < /p>

رابینسون پیراموتو در مورد سه راه برای استفاده از یادگیری عمیق برای ابداع تجارت بصری ، از جمله پیش بینی جنبه ، پیش بینی دسته برگ و شناسایی امضا برای رتبه بندی بصری بحث کرد. هر رویکرد از یک شبکه عصبی مشترک استفاده می کند ، اما لایه نهایی برای هر یک از وظایف خاص طراحی شده است.

رویکرد کلی

روش مدل سازی برای پیش بینی تصاویر داده شده از محصولات ، نیاز به آموزش تصاویر برچسب زده شده دارد. رابینسون آموزش مدل یادگیری عمیق را بر روی تصاویر با زمینه ساده در مراحل اولیه توصیه می کند تا به مدل اجازه دهد از نمونه های آسان یاد بگیرد. علاوه بر این ، او بر مفید بودن تصاویر با زوایای گوناگون که نمایانگر غنی تری از ویژگی های عکس هستند ، تأکید کرد. علاوه بر این ، نمونه برداری از تصاویر از انواع مارک ها ، فروشندگان ، شرایط و انواع کلیدی است تا بتوان مدل را به خوبی در تصاویر وحشی تعمیم داد.

https://bit.ly/300txgY

جستجوی بصری

در تجارت بصری ، به نفع بتواند محصولاتی را به مصرف کننده توصیه کند که مشابه محصولات قبلی است. برای این منظور ، لازم است محصولات مشابه را با اندازه شباهت گروه بندی کنید. رابینسون پیراموتو به جای روشهای یادگیری بدون نظارت مانند PCA یا K-Means Clustering ، استفاده از یک روش نیمه تحت نظارت را توصیه می کند. این مستلزم آموزش شبکه عصبی بر روی گروهی از کلاس ها است (Ebay از 16000 کلاس استفاده می کند) ، سپس تصاویر بدون برچسب را در شبکه قرار می دهد. در نهایت ، باید کلاسهایی را انتخاب کنید که تصویر مورد نظر بیشتر شبیه آنها است. معیارهای انتخاب کلاسهای مشابه معمولاً براساس مقادیر فعالسازی softmax است که احتمالات پیش بینی شده برای مدل برای هر کلاس را نشان می دهد. تیم رابینسون تعیین کردند که با تعیین یک آستانه برای احتمالات تجمعی ، بر اساس احتمال نرم حداکثر حداکثر عملکرد مطلوب نسبت به آستانه ها به دست آمد. در مثال زیر ، با آستانه تجمعی 0.9 ، مقوله های C1-C3 به طور مناسب شبیه تصویر مورد نظر شناخته می شوند.

پیش بینی جنبه ای

اغلب ویژگی های کلیدی در توضیحات یک مورد وجود ندارد و نیاز به راهی برای پر کردن سریع ویژگی های از دست رفته است به با مهندسی مجدد آخرین لایه کاملاً متصل برای یک شبکه عصبی پیچشی ، می توانید محصولات را بر اساس الگو ، مارک یا مد ، که در زیر نشان داده شده است ، جدا کنید.

ویژگیها باید زودتر از موعد مشخص شوند که با ویژگیهای کلیدی انتخاب مشتری مطابقت دارد و از طریق تصاویر قابل شناسایی است. به عنوان مثال ، نام تجاری را می توان با یادگیری عمیق شناسایی کرد ، اما چیزی مانند اندازه نمی تواند. ویژگی بیشتر با توجه به توصیفات محصول می تواند به رابط وب فرد اجازه دهد تا محصولات را با دقت بیشتری جستجو کند.

خوب تکراریتنظیم

رابینسون به تکنیکی جالب برای تنظیم دقیق روند آموزش شبکه های عصبی اشاره کرد که شامل تغییر میزان یادگیری از طریق یک فرآیند آموزش تکراری است. ابتدا ، یک شبکه را با نرخ یادگیری اولیه 01/0 تا زمان همگرایی مدل (یعنی فلاتهای صحت اعتبار سنجی) آموزش می دهد. خط تیره خاکستری در پایین شکل زیر نشان دهنده اولین تکرار تمرین است. سپس همان مدل با نرخ یادگیری بالاتر بازآموزی می شود که در ابتدا باعث کاهش دقت می شود ، اما با نرخ دقت بالاتری نسبت به مدل قبلی همگرا می شود. این روند تا زمانی ادامه می یابد که افزایش میزان یادگیری دیگر منجر به بهبود نشود.

< /img>

[مقاله مرتبط: 4 مرحله برای شروع یادگیری ماشین با دید رایانه]

نکات کلیدی:

از یک شبکه عصبی مشترک می توان برای رفع چالش های متعدد بصری استفاده کرد تجارت با مهندسی آخرین لایه برای کار خاص. یادگیری نیمه تحت نظارت وسیله ای م ofثر برای جستجوی بصری موارد مشابه برای تبلیغ است. طراحی نمونه برای ایجاد مدلهای م criticalثر ضروری است ؛ نمونه گیری باید شامل تنوع مساوی از ویژگی ها برای یک کلاس معین باشد. نوآوری در آموزش مدل مانند تنظیم مجدد میزان یادگیری می تواند پیشرفت قابل توجهی در عملکرد مدل ارائه دهد.

پست اصلی اینجا.

مقالات علم داده بیشتر را در OpenDataScience.com بخوانید ، از جمله آموزش ها و راهنماهای مبتدی تا پیشرفته! در خبرنامه هفتگی ما اینجا مشترک شوید و آخرین اخبار را هر پنجشنبه دریافت کنید.

اعلام چالش بینایی رایانه ای کم توان CVPR 2020-مسیر آنلاین

اعلام چالش بینایی رایانه ای کم توان CVPR 2020-مسیر آنلاین

از محققان و توسعه دهندگان PyTorch دعوت می شود تا به 2020 CVPR Lower-Power Vision Challenge (LPVC)-پیگیری آنلاین برای فیلم UAV بپیوندند. هدف از این چالش ایجاد سیستمی است که بتواند با استفاده از PyTorch Mobile و Raspberry Pi 3B+با استفاده از PyTorch Mobile و Raspberry Pi 3B کاراکترهای ویدئویی را که در فیلم ضبط شده توسط هواپیمای بدون سرنشین (UAV) ضبط و تشخیص داده و تشخیص دهد.

فناوری های بینایی رایانه ای به طور پیوسته در حال پیشرفت بوده و در ماشین هایی برای استفاده مانند تشخیص برجستگی نفت در اقیانوس ها توضیح داده شده است. محیط واقعی برای افراد کم بینا چالش این است که با پیشرفت این فناوری های بینایی رایانه ای ، به دلیل افزایش منابع محاسباتی و ذخیره سازی ، به انرژی بیشتری برای عملکرد نیاز دارند. این چالش فرصتی عالی برای جامعه PyTorch است تا به پیشرفت فناوری بینایی رایانه ای روی دستگاه برای فعال کردن بسیاری از برنامه های جدید کمک کند.

ارسال آنلاین از 16 مه 2020 تا 5 ژوئن 2020 در https باز خواهد بود: //lpcv.ai/. برای اطلاع از جزئیات بیشتر به https://lpcv.ai/20lpcvc-video-track مراجعه کنید.

با کلیک روی دکمه "LOGIN" در گوشه سمت راست بالای صفحه می توانید برای وب سایت ثبت نام کنید تا دریافت کنید آخرین اخبار.

با تشکر ،

تیم PyTorch

ایالت ها علوم کامپیوتر می خواهند ، بنابراین برنامه چیست؟

ایالت ها علوم کامپیوتر می خواهند ، بنابراین برنامه چیست؟

جنبش مردمی و سراسری ایالتی برای آموزش علوم کامپیوتر به همه دانش آموزان در چند سال گذشته بسیار دیوانه وار رشد کرده است. از توسعه چارچوب علوم رایانه K-12 در سال 2015 تا گزارش چشم انداز سیاست های علوم رایانه در سطح دولتی که در ماه مارس منتشر شد ، واضح است که دولتها متعهد به اجرای علوم رایانه K-12 هستند. اما یک برنامه منسجم در سراسر ایالت چگونه است و چگونه یک ایالت شروع به کار می کند؟ چند ایالت در واقع برنامه هایی را برای پیاده سازی علوم رایانه K-12 منتشر کرده اند.

در حال حاضر برای اولین بار ایالات ایالات متحده دارای منابع جامعی هستند. با انتشار مجموعه ابزار برنامه ریزی علوم رایانه ای دولتی ، Code.org راهنمایی ایجاد کرده است تا به تصمیم گیرندگان آموزش و پرورش در پاسخگویی به همه چیز از کجا شروع کند ، چه منابعی در دسترس است یا بهترین شیوه ها را می توان از پیاده سازی موفق آموخت.

مجموعه ابزار شامل شش بخش است که مطابق با توصیه های سیاست ارائه شده توسط اتحادیه حمایت از Code.org آمده است:

چشم انداز و اهداف کنونی: جمع آوری داده ها و بررسی چشم انداز کنونی آموزش علوم رایانه و تعیین اهداف استراتژیک . تنوع: حفظ عدالت و تنوع در خط مقدم ابتکار. خط لوله معلم: افزایش ظرفیت معلمان برای ارائه دوره های علوم کامپیوتر از طریق توسعه حرفه ای ، صدور گواهینامه و برنامه های خدماتی. برنامه درسی و دوره ها: تعریف استانداردها ، هدایت برنامه درسی و اجازه دادن به علوم رایانه برای برآوردن شرایط مورد نیاز برای فارغ التحصیلی. ارتباط: ارتباط و مشارکت درگیر قدیمی ها. بودجه: تخصیص و دسترسی به بودجه برای پیش بردن ابتکار.

برای اطلاع از منابع ، ملاحظات و توصیه ها و ابزارهای ردیابی اهداف و استراتژی ها ، امروز مجموعه ابزار برنامه ریزی علوم کامپیوتر دولتی را مشاهده کنید. کمک کنید شروع کنید ایالت خود را برای گسترش دسترسی به آموزش علوم رایانه و اطمینان از آمادگی همه دانش آموزان برای قرن 21 و پس از آن مجهز کنید.

پت یونگ پرادیت ، مدیر ارشد علمی ، Code.org

با تشکر از شما اتحاد گسترش آموزش و پرورش رایانش (ECEP) برای بررسی و ارائه بازخورد در مورد ابزار.

قبل از پایان سال 2019 چشم انداز رایانه را بشناسید

قبل از پایان سال 2019 چشم انداز رایانه را بشناسید

مروری کوتاه بر نحوه توسعه رایانه چشم انداز در 50 سال گذشته داشته باشید و درباره کلمات کلیدی مانند "AI Winter" و معنی آنها اطلاعات کسب کنید.

سال 2019 رو به اتمام است ، اما قبل از اتمام آن ، آیا خوب نخواهد بود که یکی از کلمات کلیدی دهه ما در یادگیری ماشین را درک کنیم؟ این مقاله به شما کمک می کند تا درک مختصری از کامپیوتر چشم انداز داشته باشید ، دانش کافی برای اینکه در شام کریسمس باهوش به نظر برسید.

پس از خواندن این مقاله ، با اصطلاحاتی مانند Computer Vision ، Deep learning ، آشنا خواهید شد. یادگیری ماشین ، هوش مصنوعی ، زمستان ، Skynet ... چیزهای خوب را می دانید.

بنابراین این چیزی است که من مدام در مورد آن می بینم؟

وقتی کسی این سوال را از شما می پرسد ، شما پاسخ می دهید آنها در خطوط "دید کامپیوتر همانطور است که کامپیوتر می بیند." خوب ، نه دقیقاً ، توضیحات زیر را امتحان کنید تا به طور حتم برخی از سرها را بچرخانید.

بینایی رایانه ای فرایندی است که طی آن یک ماشین یا یک سیستم با استناد به یک یا چند الگوریتم که بر روی اطلاعات عمل می کنند ، درک اطلاعات بصری را ایجاد می کند. ارائه شده است. تفاهم به تصمیمات ، طبقه بندی ها ، مشاهده الگوها و موارد دیگر ترجمه می شود. و اکنون شما سرتان را برمی گردانید.

بیایید یک درس تاریخچه سریع داشته باشیم و ببینیم که زمینه بینایی کامپیوتر چگونه توسعه یافته است.

هنگامی که ما برای تقلید تلاش کردیم ، نیاز به چشم انداز رایانه ای بوجود آمد. سیستم ادراک و بینایی در بدن انسان بنابراین سفر در دهه 1960 آغاز شد ، جایی که دانشگاهیان درک انسان را در نظر گرفتند و سعی کردند عملکرد اصلی آن را بر روی یک سیستم رایانه ای تکرار کنند. هدف دانشگاهیان پیشگام ما این بود که به ربات ها این امکان را بدهند که آنچه را که ربات مشاهده کرده است مشاهده کرده و توضیحاتی را ارائه دهند. این اولین قدم به Skynet بود (بله مانند فیلم ، اما این قبل از آن بود).

تشخیص لبه. (2019). [image] موجود در mathwork.com

به نظر نمی رسید که Skynet شبیه به انسان باشد ، بنابراین ما به تکنیک های پردازش تصویر دیجیتالی نگاه کردیم تا درک بیشتری از محتوای تصاویری که به کامپیوتر ارائه می شود ، بدست آوریم. سیستم های بینایی منظور من از درک ، استخراج اطلاعات لبه ، خطوط ، خطوط و اشکال از یک تصویر است. دهه 70 همه مربوط به الگوریتم هایی بود که می توانند اطلاعات را از یک تصویر دیجیتالی استخراج کنند.

نکته ای که باید به آن توجه کرد این است که اولین زمستان هوش مصنوعی در دهه 1970 رخ داد. برای کسانی که با اصطلاح "زمستان هوش مصنوعی" آشنا نیستند ، می توان آن را دوره ای توصیف کرد که در آن کمبود علاقه ، بودجه ، روحیه (هیاهو) و تحقیقات در حوزه های مرتبط با هوش مصنوعی مانند Computer Vision ، Machine وجود دارد. یادگیری و غیره.

دهه های 80 و 90 در بینایی رایانه ای بر ریاضیات و آمار تمرکز داشت. محققان و دانشگاهیان با روش های بینایی رایانه ای با الگوریتم های ریاضی ازدواج کردند. یک مثال خوب برای به تصویر کشیدن استفاده از ریاضیات در بینایی رایانه و تکنیک های پردازش تصویر ، یک الگوریتم تشخیص لبه خواهد بود.

تشخیص لبه یکی از تکنیک های اصلی پردازش تصویر است که در اکثر دوره های بینایی رایانه آموزش داده می شود. در سال 1986 یک آشکارساز لبه عجیب و مفید توسط John F. Canny ساخته شد. به آن می گفتندآشکارساز Canny Edge. جان اف کانی با استفاده از مفاهیم ریاضی مانند محاسبه ، تمایز و بهینه سازی عملکرد ، یک آشکارساز لبه بسیار محبوب ایجاد کرد ، و هنوز در دوره های کارشناسی ارشد تدریس می شود.

به سرعت به دهه قبل بروید دهه 2000 زمان کاملاً انقلابی برای Computer Vision بود. یادگیری عمیق پدیدار شد ، و دید رایانه دوباره موضوعات داغ رسانه ها ، محققان و دانشگاهیان شد.

تعریف کلیدی دیگری در راه است.

یادگیری عمیق زیر شاخه ای از ماشین است یادگیری ، جایی که الگوریتم ها از چندین لایه شبکه عصبی برای استخراج ویژگی های غنی تر از داده های ورودی استفاده می کنند. نمونه هایی از تکنیک های یادگیری عمیق عبارتند از: شبکه های عصبی متحرک عمیق (CNN) و شبکه های عصبی مکرر (RNN). /p> 30 اصطلاح جیبی برای مبتدیان یادگیری ماشین لیستی از اصطلاحات مفید یادگیری ماشین که در علم داده یا حرفه یادگیری ماشین با آن روبرو می شوید. towardsdatascience.com

2012 یک سال محوری در چشم انداز رایانه بود. ممکن است شما از قبل بدانید که من در اینجا قصد ذکر چه چیزی را دارم (خب خسته نباشید و آن را برای دیگران خراب نکنید). مسابقه ای به نام "ImageNet Large Scale Visual Recognition Challenge" وجود دارد ، این مسابقه سالانه برگزار می شود و بیشتر گردهمایی دانشگاهیان ، محققان و علاقه مندان با مقایسه الگوریتم های نرم افزاری است که اشیاء را در تصاویر طبقه بندی و شناسایی می کند. در سال 2012 این مسابقه با معرفی یک شبکه عصبی عمیق متحول (AlexNet) روبرو شد که میزان خطای آن در سال جاری و سالهای قبل از آن از رقبای دیگر پیشی گرفت.

من تحقیق نمی کنم جزئیات زیادی در مورد نحوه طراحی AlexNet وجود دارد ، و منابع آنلاین زیادی برای این کار وجود دارد. اما من به دو مزیت مهم AlexNet برای چشم انداز اشاره می کنم.

ابتدا GPU ها. عملکرد خیره کننده AlexNet با استفاده از واحد پردازش گرافیکی (GPU) امکان پذیر شد. اگرچه قبلا از GPU در رقابت استفاده می شد ، اما استفاده AlexNet از GPU بود که توجه و توجه جامعه بینایی رایانه را جلب کرد.

ثانیاً ، CNN ها استاندارد شدند. توانایی AlexNet برای نشان دادن اثربخشی CNN ها به این معنا بود که CNN ها رواج یافت. از آن سال به بعد ، اجرای CNN ها در اکثر برنامه های کاربردی و تحقیقات بینایی رایانه ای یافت می شود.

باید در اینجا مکث کنم ، و شاید در آینده این مقاله را در مقاله دیگری ادامه دهم. موضوعات و حوزه های زیادی وجود دارد که من به آنها اشاره نکرده ام ، اما در زیر مقالات متوسطی وجود دارد که اصطلاحات کلیدی ذکر شده در این مقاله و موارد دیگر را به تفصیل توضیح می دهد.

اکنون می توانید با داشتن تفاهم به سال 2020 بروید. بینایی کامپیوتر و توسعه آن از دهه 1960. /bq>

مقالات مربوط به Computer Vision و برخی از تکنیک های Dhruv Parthasarathy ، Siddharth Das و James Le را بررسی کنید.

تاریخچه مختصری از CNN ها در تقسیم بندی تصویر: از R-CNN تا Mask R -CNN در Athelas ، ما از شبکه های عصبی کانولوشن (CNN) برای مواردی فراتر از طبقه بندی استفاده می کنیم! در این پست ،… blog.athelas.com معماری CNN: LeNet ، AlexNet ،VGG ، GoogLeNet ، ResNet و موارد دیگر مدلهای پیشگام CNN در ILSVRC در طول سالها و سابقه شبکه های عصبی کانوولوشن 5 تکنیک بینایی رایانه ای که دید شما نسبت به جهان را تغییر خواهد داد heartbeat.fritz.ai

جایی که حریم خصوصی شما بیشتر در رایانه شما به خطر می افتد

جایی که حریم خصوصی شما بیشتر در رایانه شما به خطر می افتد

در بخش مبتدیان ما ، موضوع به خطر انداختن حریم خصوصی در دو دستگاه پرکاربرد شما را لمس کردیم: تلفن و رایانه شما. در مقاله ما تلفن شما به طور خاص در مورد یک تلفن صحبت کردیم و از آنجا که تلفن های هوشمند امروزی تقریباً رایانه های کوچکی هستند ، بیشتر این موارد در مورد این مقاله نیز صدق می کند. بردارها نیز متنوع هستند. فروشگاه های برنامه های غیر رسمی و وب سایت ها نیز خطرناک هستند. هیچ کس اعتبار و صداقت را در آنجا بررسی نمی کند و مهاجمان اغلب از این امکان به شدت استفاده می کنند. پایبندی به فروشگاه های رسمی برنامه و وب سایت های شرکت برای هر سیستم عامل ضروری است. برنامه های ترک خورده منبع دیگری برای به خطر انداختن حریم خصوصی هستند. ترک ها اغلب شامل بدافزارهایی هستند که توسط آنتی ویروس و نرم افزار ضد ویروس قابل تشخیص نیستند و به مهاجمان این امکان را می دهد که حتی دستگاه شما را تحت کنترل خود درآورند و با شما استراق سمع کنند. این امر به ویژه برای سیستم عامل های Windows و Mac OS X بسیار مهم است. استفاده از روش های حفاظتی مدرن مانند Secure Boot ضروری است زیرا آنها از کامپیوتر شما در حین دنباله بوت محافظت می کنند. Wi-Fi رایگان هزینه دارد-باز کردن شبکه Wi-Fi به این معنی است که داده های ارسال شده رمزگذاری نشده اند و مهاجمان ممکن است بتوانند اطلاعات حساس مهم مانند رمزهای عبور را استراق سمع و ربوده کنند و نرم افزارهای معمولی مانند مرورگرها می توانند مورد استفاده قرار گیرند حریم خصوصی خود را نیز تغییر دهید این امر برای رایانه ها بسیار مهم است زیرا آنها دستگاههای اصلی فعالیتهای مرور روزانه اینترنت ما هستند. بسیاری از شرکت ها از داده های شناسایی منحصر به فرد ارسال شده توسط مرورگر شما برای ردیابی و ارائه محتوای مربوطه استفاده می کنند. اطلاعات بیشتر در مورد آنها را می توانید در بخش ابزار ما بخوانید: مرورگر و زیر در بخش خواندن بیشتر.

فعال کردن رمزگذاری کامل دیسک یکی دیگر از راه های عالی برای محافظت در برابر نشت داده ها است. هر سیستم عامل چنین امکانی را ارائه می دهد و می توانید برای این کار از BitLocker در Windows و FileVault در Mac OS X استفاده کنید. طعم های لینوکس نیز امکانات متنوعی را در این زمینه ارائه می دهد و شما همیشه می توانید از راه حل چند پلتفرمی مانند VeraCrypt استفاده کنید ، که می تواند برای رمزنگاری فایل های جداگانه ، ظروف یا ایجاد حجم های رمزگذاری شده نیز استفاده شود.

خاموش کردن و/یا پوشاندن میکروفون و وب کم شما نیز یک عمل خوب است. یک دلیل واقعی وجود دارد که افراد با حریم خصوصی از روکش های وب کم استفاده می کنند. برای دریافت اطلاعات بیشتر در مورد این و دیگر چالش های حریم خصوصی در زندگی بصورت بصری ، فیلم اسنودن را که در زیر پیوند شده است مشاهده کنید.

اما خطرناک ترین آنها بدافزارها هستند ، به ویژه در سیستم عامل ویندوز. از آنجا که این سیستم عامل پرکاربردترین است ، مهاجمان بیشترین مزایا را برای هدف قرار دادن ویندوز دارند تا سایر سیستم ها. شما همیشه باید مراقب پرونده های ناشناخته باشید و از بهترین شیوه های امنیتی و نرم افزار ضد ویروس ضد ویروس برای حفظ امنیت خود استفاده کنید.

ابتدا در https://academy.horizen.global منتشر شده است.