توجه به کاغذ در مقابل توجه به استفاده از رایانه

توجه به کاغذ در مقابل توجه به استفاده از رایانه

و نحوه یادداشت برداری روی کاغذ برای حفظ اطلاعات بسیار بهتر است.

عکس توسط کلی سیکما در Unsplash

حفظ اطلاعات در حافظه بلند مدت ما یکی از مهمترین کارهایی است که می توانیم برای یادگیرندگان مادام العمر انجام دهیم.

یادگیری چیزی در کوتاه مدت چیست؟

برنامه های بینایی رایانه ای در اتومبیل های خودران

برنامه های بینایی رایانه ای در اتومبیل های خودران

نسخه به روز شده این مقاله در https://www.thinkautonomous.ai/blog/؟p=computer-vision-applications-in منتشر شده است اتومبیل های خودران این مقاله تجدید نظر از مقاله قبلی من AI ... و خودرو به صورت خودمختار رفت و در آنجا رویکردهایی را برای یافتن خطوط و موانع در جاده شرح دادم. من می خواهم از تجربیات اخیر خود در این زمینه برای افزودن به آنچه قبلاً در مورد هوش مصنوعی در وسایل نقلیه خودران نوشتم و همچنین در مورد دیگر ، پیشرفته ترین کاربردهای بینایی رایانه در وسایل نقلیه خودران بحث کرد.

قبل از شروع ، از شما دعوت می کنم به لیست ارسال نامه های خودگردان بپیوندید و هر روز یاد بگیرید در مورد اتومبیل های خودران ، دید رایانه ای و هوش مصنوعی.

مقالات پرطرفدار هوش مصنوعی:

1. مبانی شبکه عصبی 2. ترکیدن حباب اصطلاحات اصطلاحاتی - آموزش عمیق 3. چگونه می توانیم کیفیت داده های خود را ارتقا دهیم؟ 4. یادگیری ماشین با استفاده از رگرسیون لجستیک در پایتون با کد

AI ... و وسیله نقلیه خودکار رفت

این اولین مقاله را هنگام یادگیری اتومبیل های خودران با Udacity به عنوان بخشی از نانو درجه آنها نوشتم. برنامه.

در این مقاله ، من 3 مشکل ادراک عمده را برای حل با استفاده از بینایی رایانه ذکر کردم. /uli> محاسبه زاویه فرمان

برای این مشکلات ، من به ترتیب از دید رایانه رایانه ای ، یادگیری ماشین و یادگیری عمیق استفاده کردم.

چشم انداز رایانه ای برای تشخیص خطوط خط

از رایانه رایانه ای سنتی برای یافتن خطوط خط در جاده ، حتی خطوط منحنی استفاده شد. این رشته همه چیز در مورد استفاده از کتابخانه OpenCV و مطالعه رنگ پیکسل ها برای به دست آوردن شکل مناسب است.

یادگیری ماشین برای تشخیص وسیله نقلیه >

یادگیری ماشین به عنوان طبقه بندی کننده با پنجره کشویی برای یافتن اتومبیل و موانع استفاده شد. طبقه بندی SVM اغلب دارای دو کلاس بود: خودرو و خودرو. زاویه فرمان با استفاده از یادگیری تقلیدی و روش یادگیری عمیق پایان به پایان تعیین شد. من آموختم. استحکام را می توان با استفاده از فیلتر کالمن تصحیح کرد ، اما عملکرد چیز دیگری است.

یادگیری ماشین نتایج بدی برای تشخیص موانع ، به ویژه هنگام تشخیص بیش از یک کلاس ، داشت. تکنیک پنجره کشویی نیز در مقایسه با الگوریتم های اخیر بسیار کند است. یادگیری تقویتی نیز امیدوار کننده تر به نظر می رسد اما هنوز در تحقیقات تجربی است.

رویکردهای مدرن

بینایی رایانه ، یادگیری ماشین و یادگیری عمیق به طور کلی راه حل های خوبی برای مشکلات ادراکی هستند.

< p> اخیراً ، یادگیری عمیق با استفاده از شبکه های عصبی کانولوشن از هر تکنیک دیگری برای تشخیص خط و موانع پیشی گرفته است. آنقدر که حتی ارزش امتحان چیز دیگری را ندارد.

مقاله قبلی من از شبکه های عصبی متحد (CNNs) به عنوان روشی جدید برای حل مشکلات بینایی رایانه یاد کرد.

< p> CNN ها معماری خاصی از شبکه های عصبی هستند که می توانند با استفاده از Convolutions شکل های خاصی (مانند اتومبیل ، عابر پیاده و ...) را بیاموزند. از داده های بیشتری نسبت به الگوریتم های یادگیری ماشین استفاده می کند ، و آموزش سخت تر است ، اما نتایج بسیار بهتر است.

معماری یادگیری عمیق امروزه می تواند برای اهداف خاصی مانندتشخیص جعبه محدوده یا رگرسیون ضریب خط. بر خلاف "روش طبقه بندی" ، نیازی به استفاده از پنجره کشویی یا هیستوگرام برای خروجی نتیجه مورد نظر نیست. شبکه های عصبی را می توان طوری تنظیم کرد که هر چه می خواهیم تولید کنند.

تشخیص خودرو

هنگام تشخیص موانع ، نتیجه به طور کلی فراتر از خروج ساده خودرو یا عدم رانندگی است. ما به مختصات کادر محدود کننده (x1 ، y1 ، x2 ، y2) نیاز داریم که قبلاً با پنجره کشویی داشتیم. ما به اطمینان نمره (تا آستانه مقادیر اطمینان پایین) و کلاس (خودرو ، عابر پیاده ،…) که الگوریتم SVM بدست آورده ایم نیاز داریم. در انتهای شبکه عصبی.

لایه های متحرک برای یادگیری ویژگی های مستقل (اندازه ، رنگ ، شکل) در حالی که آخرین لایه ها در اینجا برای خروجی هستند. آنها یاد می گیرند که مختصات جعبه محدود کننده و سایر ویژگیهای مرتبطی را که ما به آنها نیاز داریم ، تولید کنند. همه در یک شبکه عصبی واحد انجام می شود.

معماری CNN برای تشخیص موانع < /img> در روش یادگیری ماشین سنتی ، یک نورون خروجی وجود دارد که بسته به اینکه آیا اتومبیل در پنجره خاصی وجود دارد یا خیر ، مقدار 0 یا 1 را می گیرد. یادگیری خروجی جعبه محدود به طور مستقیم امکان محاسبه بسیار سریعتر و نتایج دقیق تر را می دهد. الگوریتم هایی مانند YOLO امروزه به عنوان پیشرفته ترین هنر در نظر گرفته می شوند ، آنها می توانند با فرکانس بسیار بالا (بیش از 50 فریم بر ثانیه) اجرا کنند و تقریباً هرگز موانع را از دست ندهند.

تشخیص خطوط مسیر

برای تشخیص خطوط خط ، یادگیری عمیق را می توان دقیقاً به همان شیوه استفاده کرد.

نقش ایجاد ضرایب معادله خط خط است. خطوط خط را می توان با معادلات ضرایب درجه اول ، دوم یا سوم تقریب زد. معادله مرتبه اول به سادگی ax+b (یک خط مستقیم) است در حالی که ابعاد بالاتر اجازه ایجاد منحنی ها را می دهد.

خطوط 1D در مقابل خط دو بعدی

در CNN ، لایه های کانولوشن ویژگی ها را می آموزند ، در حالی که آخرین لایه ها ضرایب خط (a ، b و ج).

این ممکن است ساده به نظر برسد: چند لایه پیچشی تنظیم کنید ، چند لایه متراکم تنظیم کنید و معماری خروجی را تنها با 3 نورون برای ضرایب a ، b و c تنظیم کنید.

< در واقع ، این راه سخت تر است. مجموعه داده ها همیشه ضرایب خطوط خط را ذکر نمی کنند و همچنین ممکن است بخواهیم نوع خط (خط کشی ، جامد ،…) و همچنین اینکه آیا خط متعلق به خط وسیله نقلیه ego است یا به یک خط مجاور تشخیص دهیم. ویژگیهای متعددی وجود دارد که ممکن است بخواهیم داشته باشیم و آموزش یک شبکه عصبی واحد بسیار دشوار و تعمیم آن دشوارتر است.

یک روش رایج برای حل این مشکل استفاده از تقسیم بندی است. در تقسیم بندی ، هدف این است که به هر پیکسل یک تصویر کلاس داده شود.

یک رنگ در هر کلاس

در این رویکرد ، هر خط مربوط به یک کلاس (ego چپ ، ego راست ، ...) است و هدف شبکه عصبی ایجاد تصویری فقط با این رنگ ها است.

نمونه تصویر خروجی

در این نوع معماری ، سیستم عصبی شبکه در دو قسمت کار می کند قسمت اول ویژگی ها را یاد می گیرد ، قسمت دوم خروجی را می آموزد. درست مانند تشخیص جعبه.

معماری U-Netبرای تشخیص خطوط

اگر خروجی یک تصویر سیاه ساده با رنگ ، استفاده از یادگیری ماشین و رگرسیون خطی (یا چندگانه) برای یافتن خطوط خط در نقاط رنگی بسیار ساده است. 10 برابر سریعتر در آزمایشاتم ، 5 رویکرد FPS برای رویکرد دید رایانه ای و حدود 50 FPS برای رویکرد یادگیری عمیق داشتم.

موارد دیگر برای یادگیری عمیق در اتومبیل های خودران-ردیابی

I اخیراً مقاله ای منتشر شد که بسیار مورد توجه قرار گرفت: چشم انداز رایانه ای برای ردیابی.

در این مقاله ، من به تکنیکی برای ردیابی موانع در طول زمان با استفاده از دوربین ، یادگیری عمیق و الگوریتم های هوش مصنوعی مانند کالمن اشاره می کنم. فیلترها و الگوریتم مجار.

در اینجا ، جعبه های محدود کننده مانند یک روش کلاسیک YOLO رنگ ها را از قاب 1 به قاب 2 تغییر نمی دهند. اتومبیل سمت راست دارای یک جعبه محدود مشکی در قاب 1 و در قاب 2 به دلیل ارتباط است. اشیاء همرنگ جعبه های رنگی یکسانی ندارند.

یادگیری این نتیجه برای شبکه های عصبی بسیار دشوار است. به همین دلیل است که ما از فیلترینگ بیزی و الگوریتم ارتباط استفاده می کنیم. در اینجا درک بهتری داشته باشید.

در این رویکرد ، Deep Learning برای محدود کردن تشخیص جعبه استفاده می شود و نتیجه بلافاصله به الگوریتم های دیگر منتقل می شود که تصمیم می گیرند آیا وسیله نقلیه قبلی مشابه است یا خیر. به برای تصمیم گیری ، ویژگی های متغیر نیز می توانند به عنوان مطابقت بستگی به ظاهر شیء داشته باشند. برای یادگیری عمیق در اتومبیل های خودران-جعبه های محدود کننده سه بعدی

جعبه های محدود کننده بسیار عالی هستند تا بتوانیم موانع را بومی سازی کنیم. با این حال ، داشتن محلی سازی دو بعدی با مختصات پیکسل ممکن است چندان مفید نباشد. آنچه ترجیح داده می شود این است که موقعیت سه بعدی با x ، y ، z به طور مستقیم وجود داشته باشد.

حرکت از جعبه های محدود کننده دو بعدی به سه بعدی به شما امکان می دهد موقعیت و فاصله دقیق وسیله نقلیه را از ما ، و همچنین جهت دقیق و جهت.

به نظر می رسد که از مختصات پیکسل این امر بسیار دشوار است:

بدست آوردن x و y به این معنی است که ما می توانیم فاصله خودرو را نسبت به دوربین خود دقیق و دقیق داشته باشیم فاصله جانبی و طولی ، از مختصات جعبه محدود. بدست آوردن z به معنای آن است که ما برای مانع نیز یک عدد بالا داریم ، که فقط از کلاس جسم قابل تخمین است. جعبه های محدود کننده 2 بعدی در مقابل 3D (منبع)

مقاله مربوط به روشی برای برآورد جعبه های محدود کننده سه بعدی بحث می کند با استفاده از یادگیری عمیق و هندسه.

معماری شبکه عصبی برای برآورد سه بعدی

در این رویکرد ، Deep Learning مجدداً برای یادگیری ویژگی (ابعاد ، زاویه ، اطمینان) استفاده می شود. سپس از هندسه برای ترجمه اطلاعات به جهان سه بعدی استفاده می شود.

داشتن جعبه های محدود کننده سه بعدی می تواند امکان مطابقت سه بعدی با سنسورهای سه بعدی مانند LiDAR ها را فراهم کند. این اجازه می دهد تا درک بهتری از جهت یک وسیله نقلیه و سپس پیش بینی رفتار آن داشته باشید. جعبه های دوبعدی اغلب هنگامی ارائه می شود که مردم تکنولوژی اتومبیل های خودران را بیاموزند. با این حال،جعبه های محدود کننده سه بعدی بسیار بیشتر با مشکل مرتبط هستند.

تشخیص فضای آزاد

تشخیص فضای آزاد در دنیای خودروهای خودران بسیار مشهور است. با این حال ، بسیاری از مردم هنوز تعجب می کنند که چه کاربردی دارد. من فرصتی برای استفاده از آن نداشتم زیرا پیشرفت ها استفاده از فضای آزاد را در اولویت قرار نمی دهند. اما امیدوارم ایده خوبی در مورد استفاده داشته باشم.

معماری شبیه بخش تقسیم بندی با مشکل تشخیص خط است.

SegNet

روش رمزگذار-رمزگشایی مشابه روش U-Net است. رمزگذار به معنای پیچیدگی و ویژگی های یادگیری ، رمزگشایی به معنی بازسازی نقشه ویژگی ها است.

فضای آزاد می تواند بسیار مفید باشد تا بدانید چگونه در یک وسیله نقلیه آهسته حرکت کنید و خط را تغییر دهید. همچنین می تواند در مواقعی که خطوط در دسترس نیستند و نیاز به بازسازی دارند یا موانعی بر سر راه وجود دارد و خودرو باید متوقف شود مورد استفاده قرار گیرد. بنابراین می توان از Freespace برای افزونگی با الگوریتم های تشخیص موانع استفاده کرد. خلبان خودکار تسلا نرم افزار freespace

نتیجه گیری

ما در مورد روش های متعدد استفاده از Computer Vision و Deep Learning در خودروهای خودران بحث کرده ایم. هدف همیشه یکسان است ؛ پیدا کردن موانع و خطوط ، برآورد سرعت ، جهت و موقعیت. یادگیری عمیق از بسیاری از تکنیکهایی که به راحتی در دسترس هستند مانند دید رایانه ای سنتی و یادگیری ماشین پیشی می گیرد. این تکنیک ها هنوز برای تکمیل یادگیری عمیق در کار نهایی مورد نیاز هستند. رویکردها همیشه در حال تغییر هستند و اگر نمی دانید چگونه با استفاده از تکنیک های جدید به طور مکرر سازگار شوید ، چالش برانگیز است. در نهایت ، دوربین ها قادر به انجام بسیاری از کارها هستند. یادگیری عمیق تقریباً هرگز تنها نیست. همیشه الگوریتم هایی وجود دارد که راه حل را قوی تر می کند یا نتیجه شبکه های عصبی را با خروجی مورد نظر ما تطبیق می دهد. ما می توانیم راه حل های بیشتری مانند برآورد فاصله با استفاده از اندازه ها و کلاسهای محدوده یا ترکیب ردیابی در طول زمان تصور کنیم. با جعبه محدود 3D برای ایجاد یک ردیاب موانع 3D با استفاده از یک دوربین تک چشمی. استفاده از زمان عامل مهمی است زیرا ممکن است بخواهیم رفتارهای دیگر وسایل نقلیه را در آینده پیش بینی کنیم. camera. قبل از نتیجه گیری ، می خواهم شما را به لیست پستی خصوصی دعوت کنم. هر روز ، ایمیلی ارسال می کنم که در آن تجربه خود را در زمینه هوش مصنوعی و فناوری خودمختار به اشتراک می گذارم. از فردا ، شما مشاوره های شغلی تغییر دهنده زندگی ، محتوای فنی مانند این یا تخفیف برای دوره های من دریافت خواهید کرد. در اینجا مشترک شوید ، امیدوارم شما را در ایمیل فردا ببینم. جرمی کوهن. (منبع)

فراموش نکنید که your خود را به ما بدهید!

بینایی رایانه ای در تسلا

بینایی رایانه ای در تسلا

این مقاله در https://www.thinkautonomous.ai/blog/؟p=computer-vision-at-tesla عکس توسط Vlad Tchompalov در Unsplash

وقتی به دنیای بینایی رایانه نگاه می کنیم ، می توانیم یک فاصله واقعی بین دوره های واقعیت و آنلاین مشاهده کنید.

به عنوان مثال ، شما ممکن است در یک دوره آنلاین نحوه اجرای یک شبکه YOLO را بیاموزید ، اما یک مورد استفاده در دنیای واقعی ممکن است 7 شبکه YOLO را در GPU های توزیع شده درخواست کند. و معماری HydraNet این چه عجایبی است؟ ما همه اینها را در Coursera نیاموختیم!

بنابراین امروز ، تصمیم گرفتم ویدیویی را از Andrej Karpathy ، AI Lead در تسلا جدا کنم و آنچه را که در داخل نرم افزار تسلا اتفاق می افتد برای شما توضیح دهم. پیوند ویدیو را در پایان این مقاله به اشتراک می گذارم.

امیدوارم متوجه شوید که هیچ چیز را نمی توانید درک کنید ، حداقل از یک مفهوم سطح بالا. < /p>

عمیقاً در زیر فرو می رویم:

وظایف - تسلا چه می کند؟ سنسورها - خلبان خودکار از چه حسگرهایی استفاده می کند؟ شبکه های عصبی - تسلا چگونه شبکه های عصبی خود را معماری می کند؟ آموزش - آموزش شبکه چگونه اتفاق می افتد؟ مرور کامل پشته - مرور کلی سیستم کامل آنها.

به طور خاص ، ما به یکی از نگرانی های مهم تسلا می پردازیم: 50 کار باید روی رایانه انجام شود ، به طور همزمان ، در رایانه ای که فضای زیادی را اشغال نمی کند.

رایانه FSD

پس بیایید به آن برسیم!

قبل از آن

من یک لیست پستی در مورد فناوریهای خودمختار ، کامپیوتر دارم بینایی و هوش مصنوعی اکثر افراد در آن مهندسانی مانند شما هستند و روزانه ایمیل هایی دریافت می کنند که حاوی محتوای فنی ، نکات شغلی و داستانهای داخلی است که هر روز زندگی آنها را تغییر می دهد. - ایمیل های خصوصی را در این پیوند دریافت کنید!

1. وظایف

به گفته ایلان ماسک ، از ابتدای ژوئیه (2020) ، تسلا به خودروهای کاملاً خودران نزدیک است-که به عنوان خودمختاری سطح 5 نیز شناخته می شود. چه واقعیت داشته باشد چه نباشد ، یک چیز بیش از پیش روشن می شود: تسلا آماده است تا قبل از دیگران به خودمختاری کامل برسد. هنگامی که آنها این کار را انجام می دهند ، بقیه احتمالاً به سرعت دنبال می شوند.

دستیابی تسلا به سطح 5 برابر است با راجر بانیستر ورزشکار که برای اولین بار یک مایل را در 4 دقیقه می دوید. این کار کاملاً غیرممکن بود ، تا اینکه راجر بنیستر آن را انجام داد ، و سپس همه ناگهان دنبال کردند.

یک وسیله نقلیه تسلا چه کار می کند؟

عملکرد اصلی هر وسیله نقلیه خودران ، از جمله کارهایی که در تسلا انجام می شود این است که در خط صحیح بمانید ، سپس مسیر را تغییر دهید تا مسیر درست را دنبال کنید.

بدیهی است که وظایفی مانند تشخیص موانع بخش بزرگی از پشته است. و ویژگی های دیگر مانند Smart Summon به خودرو اجازه می دهد تا راننده را در یک پارکینگ پیدا کند. این وظایف اضافی ، در میان سایر وظایف ، به خط اصلی و مسیر اصلی حرکت می کند تا به سمت هدف بلند مدت حرکت کند: قابلیت های کامل خودران.

تسلا باید تمام این وظایف را انجام دهد وظایف تسلا امروزه مشهور است. از تشخیص خط ، مهمترین ویژگی خودروهای خودران گرفته تا ردیابی عابران پیاده ، آنها باید همه چیز را پوشش دهند و هر سناریویی را پیش بینی کنند. برای این منظور ، آنها از حسگرها استفاده می کنند.

2. حسگرها

تسلا از 8 دوربین برای عملکرد استفاده می کند. با این کار ، آنها می توانند تمام مناطق اطراف وسیله نقلیه را پوشش دهند تا نقطه کوری وجود نداشته باشد.

نمای از 8 دوربین

8 دوربینبا RADAR های اضافی ترکیب می شوند تا بتوانند موانع را به طور م locateثر شناسایی و آنها را شناسایی کنند. RADAR ها حسگرهای مکمل بسیار خوبی هستند زیرا می توانند سرعتها را مستقیماً تخمین بزنند. می توانید در مقاله RADAR من بیشتر بیاموزید.

این تصاویر دوربین چگونه پردازش می شوند؟ استفاده از شبکه های عصبی.

نگران از دست دادن آخرین اخبار ML نباشید. مشترک شوید و اجازه دهید آن را پیدا کنیم و هر هفته با شما و 14000 نفر دیگر به اشتراک بگذاریم.

3. شبکه های عصبی

بین وسایل نقلیه ، خطوط پیاده رو ، حاشیه جاده ها ، گذرگاه ها و سایر متغیرهای محیطی خاص ، تسلا کارهای زیادی برای انجام دادن دارد. در حقیقت ، آنها باید حداقل 50 شبکه عصبی را به طور همزمان اجرا کنند تا بتواند کار کند. این امر در رایانه های معمولی امکان پذیر نیست.

تسلا از معماری خاصی به نام HydraNets استفاده می کند ، جایی که ستون فقرات به اشتراک گذاشته می شود. HydraNets دارای ستون فقرات در تمام اجسام و سرهایی است که در کارهای خاص آموزش دیده اند. این باعث افزایش سرعت استنتاج و همچنین سرعت آموزش می شود.

شبکه عصبی تسلا < /img>

شبکه های عصبی با استفاده از PyTorch ، یک چارچوب یادگیری عمیق که ممکن است با آن آشنا باشید ، آموزش می بینند.

هر تصویر با ابعاد (1280 ، 960 ، 3) ، از طریق این عصب خاص منتقل می شود. شبکه. ستون فقرات یک ResNet 50 اصلاح شده است - اصلاح خاص استفاده از "Dilated Convolutions" است. سرها بر اساس تقسیم بندی معنایی - معماری FPN/DeepLab/UNet به با این حال ، به نظر نمی رسد "پایان کار" باشد زیرا تبدیل بین پیکسل های دو بعدی و سه بعدی مستعد خطا است. من هر دو این مفاهیم را در درس خود آموزش می دهم SEGMENTATION IMAGE: تکنیک های پیشرفته برای کامپیوترهای مشتاق کارشناسان بینایی من این دوره را برای همه کسانی که می دانند چگونه backpropagation کار می کند طراحی کردم-این تنها شرط لازم در کنار پایتون مبتدی است.

چیز دیگری که تسلا استفاده می کند نمای چشم پرنده است

گاهی اوقات نتایج یک شبکه عصبی باید به صورت سه بعدی تفسیر شود. نمای چشم پرنده می تواند به تخمین فاصله ها کمک کند و درک بسیار بهتر و واقعی تری از جهان ارائه دهد.

احضار هوشمند در تسلا با استفاده از نمای چشم پرنده

برخی از کارها بر روی چندین دوربین اجرا می شوند. به عنوان مثال ، برآورد عمق چیزی است که ما عموما در دوربین های استریو انجام می دهیم. داشتن 2 دوربین به تخمین بهتر فاصله ها کمک می کند. تسلا این کار را با استفاده از شبکه های عصبی با رگرسیون در عمق انجام می دهد.

برآورد عمق از 2 دوربین با استفاده از این دید استریو و ادغام سنسور ، تسلا نیازی به LiDAR ندارد. آنها می توانند برآورد فاصله را تنها بر اساس این دو دوربین انجام دهند. تنها ترفند این است که دوربین ها از لنزهای یکسان استفاده نمی کنند: در سمت راست ، فاصله های بیشتر بسیار نزدیک تر به نظر می رسند.

تسلا همچنین وظایف مکرر مانند برآورد چیدمان جاده دارد. این ایده مشابه است: چندین شبکه عصبی به طور جداگانه اجرا می شوند و یک شبکه عصبی دیگر در حال ایجاد اتصال است.

به صورت اختیاری ، این شبکه عصبی می تواند مکرر باشد تا زمان را در بر گیرد.

problem مشکل اصلی تسلا این است که از 8 دوربین ، 16 مرحله زمانی (مکرر معماری) ، و اندازه دسته ای 32.

به این معنی است که برای هر پاس رو به جلو ، 4096 تصویر پردازش می شود. من در مورد شما اطلاعی ندارم ، اما MacBook Pro من هرگز نمی تواند از این پشتیبانی کند. در واقع ، GPU نمی تواند این کار را انجام دهد - نهحتی 2 GPU!

برای حل این مشکل ، تسلا روی معماری HydraNet شرط بندی می کند. هر دوربینی از طریق یک شبکه عصبی واحد پردازش می شود. سپس همه چیز در شبکه عصبی میانی ترکیب می شود. نکته شگفت انگیز این است که هر کاری تنها به چند قسمت از این شبکه غول پیکر نیاز دارد.

به عنوان مثال ، تشخیص شیء فقط به دوربین جلو ، ستون فقرات جلو و دوربین دوم نیاز دارد. همه چیز یکسان پردازش نمی شود.

8 شبکه عصبی اصلی مورد استفاده تسلا

4. آموزش

آموزش شبکه با استفاده از PyTorch انجام می شود. چندین کار مورد نیاز است و آموزش بر روی 48 سر شبکه عصبی می تواند زمان زیادی را صرف کند. در حقیقت ، آموزش برای تکمیل به 70،000 ساعت GPU نیاز دارد. تقریباً 8 سال است.

تسلا در حال تغییر حالت آموزش از "رفت و برگشت" به "استخر کارگران" است. در اینجا ایده وجود دارد: در سمت چپ - گزینه طولانی و غیرممکن. در وسط و راست ، گزینه های جایگزین مورد استفاده آنها.

من جزئیات زیادی برای به اشتراک گذاشتن آن قسمت ندارم ، اما اساساً ، این مجموعه از کارگران به موازات وظایف سریعتر شدن شبکه به هم نزدیک می شوند.

5. بررسی کامل پشته

امیدوارم اکنون ایده روشنی از نحوه کار در آنجا داشته باشید. درک آن غیرممکن نیست ، اما قطعاً متفاوت از چیزی است که ممکن است به آن عادت کرده باشیم. چرا؟ از آنجا که این شامل مشکلات بسیار پیچیده ای در دنیای واقعی است.

در یک دنیای کامل ، شما نیازی به معماری HydraNet ندارید-فقط از یک شبکه عصبی در هر تصویر و در هر کار استفاده کنید ... اما امروزه ، انجام این کار غیرممکن است.

علاوه بر این ، تسلا باید به طور مداوم نرم افزار خود را بهبود بخشد. آنها باید داده های کاربران را جمع آوری کرده و از آنها استفاده کنند. از این گذشته ، آنها هزاران وسیله نقلیه دارند که در آنجا رانندگی می کنند ، احمقانه خواهد بود که از داده های آنها برای بهبود مدل خود استفاده نکنند. هر داده ای جمع آوری ، برچسب گذاری و برای آموزش استفاده می شود. شبیه فرایندی به نام یادگیری فعال (در این مورد در اینجا اطلاعات بیشتری کسب کنید).

این حلقه کامل است. پشته کامل تسلا

بیایید پشته را از پایین به بالا تعریف کنیم.

داده-تسلا داده ها را از وسایل نقلیه و تیمی برچسب می زنند. GPU Cluster - تسلا از چندین GPU (که خوشه ای نامیده می شود) برای آموزش شبکه های عصبی آنها و اجرای آنها استفاده می کند. DOJO - تسلا از چیزی استفاده می کند که آنها دوجو می نامند فقط بخشی از کل معماری را برای یک کار خاص آموزش دهد. این بسیار شبیه به آنچه آنها در استنباط انجام می دهند است. آموزش توزیع شده PyTorch - تسلا از PyTorch برای آموزش استفاده می کند. ارزیابی - تسلا آموزش شبکه را با استفاده از توابع ضرر ارزیابی می کند. استنتاج ابری - پردازش ابری به تسلا اجازه می دهد تا ناوگان خودروهای خود را به طور همزمان بهبود بخشد. استنتاجFSD - تسلا رایانه خود را ساخته است که دارای واحد پردازش عصبی (NPU) و GPU های خود برای استنتاج است. حالت سایه-تسلا نتایج و داده های خودروها را جمع آوری کرده و آنها را با پیش بینی هایی که برای بهبود حاشیه نویسی مقایسه می شود مقایسه می کند: این یک حلقه بسته است!

⏩ در اینجا ویدئویی است که همه چیز را شرح می دهد. فقط تصاویری را که به شما نشان دادم نوشتم و جمع آوری کردم.

ممکن است کمی از همه چیز که توضیح دادم غرق شده باشید. بسیار پیشرفته تر از آن چیزی است که اکثر دوره ها آموزش می دهند ، و طبیعی است. با این حال ، امروزه شرکت ها اینگونه عمل می کنند. آن استبه ندرت می توان شرکتی را مشاهده کرد که از دسته های از پیش ساخته شده از لایه های متحرک بدون تغییر استفاده کند.

در اینجا خلاصه ای از همه مواردی است که ما در مورد آن بحث کردیم:

تسلا همزمان روی 50 وظیفه کار می کند ، که باید همه آنها بر روی یک کامپیوتر بسیار کوچک به نام FSD (Fully Self-Driving) اجرا می شوند. برای انجام این کار ، آنها از معماری HydraNet استفاده می کنند که به آنها اجازه می دهد از شبکه یکسانی برای هر کاری ، فقط با سرهای مختلف استفاده کنند. همه سرها شامل تقسیم بندی تصویر می شوند. تسلا از 8 دوربین استفاده می کند که با هم ادغام شده اند. هر دوربینی برای یک کار واحد استفاده نمی شود. آموزش با استفاده از PyTorch و مجموعه ای از معماری کارگران (برخی از وظایف به طور همزمان آموزش می بینند) انجام می شود. یک حلقه کامل اجرا می شود: رانندگان داده ها را جمع آوری می کنند ، تسلا این داده های دنیای واقعی را برچسب گذاری می کند و سیستم آنها را بر روی آن آموزش می دهد.

هدف تسلا این است که اولین شرکتی باشد که به خودمختاری کامل دست یافته است. امروزه آنها با ارزش ترین شرکت خودروسازی در کل جهان هستند و قصد توقف در آنجا را ندارند. آنها با چالش های جالبی روبرو هستند که ما در هنگام یادگیری هوش مصنوعی و یادگیری عمیق از راحتی خانه های خود با آنها روبرو نیستیم.

امیدوارم داستان امروز به شما در بررسی نحوه "دنیای واقعی" کمک کرده باشد. انجام می دهد! اگر می خواهید بیشتر پیش بروید ، در ایمیل های خصوصی من مشترک شوید و اطلاعات ، راهنمایی ها و داستانهای روزانه در مورد AI ، Computer Vision و Autonomous Vehicles را دریافت کنید! جرمی کوهن

>

تبصره ویرایشگر: ضربان قلب یک نشریه و انجمن آنلاین مبتنی بر مشارکت است که به کاوش در تقاطع نوظهور توسعه برنامه تلفن همراه و یادگیری ماشین اختصاص داده شده است. ما متعهد هستیم که از توسعه دهندگان و مهندسان از هر قشری حمایت و الهام بگیریم.

مستقل از نظر ویرایش ، Heartbeat توسط Fritz AI ، پلت فرم یادگیری ماشینی که به توسعه دهندگان کمک می کند تا دستگاه ها را ببینند ، بشنوند ، حمایت و منتشر می شود. حس کنید و فکر کنید ما به مشارکت کنندگان خود پرداخت می کنیم و تبلیغات نمی فروشیم.

اگر می خواهید مشارکت داشته باشید ، به تماس ما برای مشارکت کنندگان سر بزنید. همچنین می توانید برای دریافت خبرنامه های هفتگی ما (هفته نامه یادگیری عمیق و خبرنامه هوش مصنوعی Fritz) ثبت نام کنید ، در Slack به ما بپیوندید و Fritz AI را در توییتر دنبال کنید تا آخرین یادگیری ماشین تلفن همراه را مشاهده کنید.

تجربه من با استفاده از برنامه های کارشناسی ارشد علوم کامپیوتر بدون سابقه

تجربه من با استفاده از برنامه های کارشناسی ارشد علوم کامپیوتر بدون سابقه

[چرا تصمیم گرفتم به مقطع دبیرستان بروم]

به طور کلی نحوه علاقه مندی خود را ارائه کردم در مطالعه علوم کامپیوتر در پست قبلی وبلاگم. این همه عالی است ، اما همه هنگام انتخاب حرفه ای در علوم کامپیوتر ، مسیر دانشگاه را انتخاب نمی کنند. اما در اینجا دلایل من برای اینکه چرا من به دنبال آموزش رسمی هستم آمده است:

اگرچه اینترنت یک منبع عالی برای یادگیری مقادیر زیادی از مطالب است ، اما من فکر کردم که با چارچوب و راهنمایی ارائه شده توسط من احساس راحتی بیشتری خواهم کرد. یک برنامه و شرکت در کلاس ها به صورت حضوری. من در مورد نحوه و نحوه عملکرد برخی جنبه های کد کنجکاو بودم. امیدوارم در مورد نظریه و منطق فرایندهای کامپیوتری اطلاعات بیشتری کسب کنم. اما بدیهی است که هدف نهایی ، انتقال موفقیت آمیز شغلی بود. به عنوان یک دانشجوی بین المللی ، من واقعاً ویزا می خواستم ...

به هر حال ، من نویسنده بزرگی نیستم ، اما احساس کردم همانطور که در حین آماده شدن برای درخواست برنامه کارشناسی ارشد در علوم کامپیوتر ، نمی توانم به منابع بسیار زیادی مراجعه کنم. بنابراین در اینجا تلاش صادقانه من برای به اشتراک گذاشتن تجربه کامل من است. امیدوارم کمک کند.

با من تحمل کنید

0 پیشینه علمی صادقانه من

دانشجوی بین المللی از کره جنوبی (با عرض پوزش ، بدون امتیاز تافل) معدل: 3.31 دانشگاه اموری کارشناسی گرایش ها: لیسانس زیست شناسی و مطالعات بین المللی سابقه کار: 2 سال تحقیقات بالینی نمرات GRE: V-160 (صدک 86)/Q-162 (صدک 81)/W -4 (صدک 60) تهیه لیست مدارس

بی شرمانه اعتراف می کنم که لیست مدارس بالقوه خود را بر اساس لیست های ارائه شده توسط این رتبه بندی ها انتخاب کرده ام:

https://www.usnews.com/best -مدارس فارغ التحصیلی/مدارس علمی-برتر/کامپیوتر-علوم-رتبه بندی https://tfetimes.com/best-computer-science-program-rankings//uli/

بودن راستش ، من نمی دانستم چگونه فهرستی از مدارس تهیه کنم و برای من ، این مکان عالی برای شروع بود.

2. فیلتر کردن لیست مدارس

در اینجا مواردی است که من هنگام مشاهده برنامه های مختلف به آنها توجه کردم: لیسانس در علوم کامپیوتر یا دانش آموزان پذیرفته شده با مدرک کارشناسی در زمینه کمی مانند مهندسی ، ریاضی ، فیزیک و غیره در س theالات متداول یا بخش دانشجویان آینده نگر. مدت زمان برنامه-من می خواستم یک تجربه کامل دو ساله داشته باشم تا حداقل دانش کافی را برای ورود به یک رشته متفاوت کسب کنم. حداقل این مدت زمانی است که احساس می کردم قبل از ورود به این رشته به آن نیاز دارم. نام /نوع مدرک تحصیلی-من به دلایل فوق به دنبال مدرک کارشناسی ارشد در دانشگاه بودم تا مدرک حرفه ای ^. در اینجا تفاوت توضیح داده شده است: https://www.northeastern.edu/graduate/blog/professional-degrees-vs-academic-graduate-degrees/ نوع برنامه-آیا این یک برنامه عمومی CS است؟ آیا برنامه CS مبتنی بر غلظت است؟ چه نوع کلاس هایی ارائه می دهند؟ چه کلاسهای جالبی می توانم شرکت کنم؟ چقدر در انتخاب رشته های انتخابی آزادی دارم؟ چه نوع تحقیقاتی وجود دارد (زمانی که فکر می کردم می خواهم پایان نامه ای انجام دهم ... یا گزینه ای. HAHA ... نه متشکرم.)؟ مدرسه وابسته به برنامه در دانشگاه - می خواستم بهترین آموزشی که هر کس همیشه باید بخواهدمن همچنین برای فارغ التحصیلان یک مدرسه ارزش قائل بودم. مکان-می خواستم در نزدیکی یک شهر بزرگ باشم. بدیهی است ، $ $ $ TUITION $ $ $.

3. تصمیم گیری در مورد کلاسها

در نهایت یک صفحه گسترده با نام مدرسه ، محل تحصیل ، شهریه ، مهلت درخواست و دوره های پیش نیاز ایجاد کردم. من همچنین باید هنگام تهیه لیست پیش نیازها مراقب باشم زیرا برخی از پیش نیازها پیش نیازهای خاص خود را داشتند. SIGH.

من کاملاً مطمئن نیستم که میزان پذیرش در چه نوع/تعداد کلاس های CS/ریاضی شرکت کرده است. من فقط لیستی از دوره ها را بر اساس همپوشانی تهیه کردم و می دانستم که باید خوب کار کنم. به هر حال ، در اینجا لیستی از کلاسها و نمرات من آمده است: الف) جبر خطی (A-) حساب دوم (B+-زمانی که این کلاس تمام شد ، من قبلاً در برنامه پذیرفته شده بودم) مقدمه ای بر برنامه نویسی در C ++ (B+) ساختار داده ها در C ++ (A-) معماری کامپیوتر-(A: در واقع اکثر مدارس در مورد سیستم های کامپیوتری کلاس خواسته اند ... این کلاس نزدیکترین چیزی که من می توانستم پیدا کنم. و من آن را دوست داشتم!)

فقط یک FYI ، برنامه های پس از مدرک کارشناسی/برنامه های گواهینامه حرفه ای وجود دارد که می تواند شما را برای مدارس مقطع دبیرستان و مراحل حرفه ای آماده کند. برای نام بردن چند مورد: NYU ، Columbia ، Tufts ، BU ، و غیره ... (مطمئنم تعداد بیشتری وجود دارد).

4. آماده شدن برای GRE

من کتاب آمادگی GRE Barron را خریدم و همچنین برای یک برنامه 3 ماهه Magoosh (*زمانی که در فروش بود*) ثبت نام کردم. من فکر می کردم هر دو منبع از نظر تمرین زیاد بسیار عالی هستند.

من نمی توانم با اطمینان بگویم که هنگام آماده شدن برای GRE خود انضباط زیادی داشتم. من تقریباً یک ماه قبل از امتحانم به طور جدی درس خواندم ، که احتمالاً بهترین نبود. با این حال ، من دائماً در حال جستجوی کارت های واژگانی بودم که از طریق Magoosh به صورت رایگان در فروشگاه برنامه شما موجود است. واقعا مهم است من بیشتر روی بخش کمی تمرکز کردم اما برای مدتی که گذاشتم ، باور ندارم که در تاریخ آزمون خیلی خوب عمل کرده ام.

اما همانطور که مردم می گفتند ، GRE برای مواد مخدر SAT بود و من امیدوارم دیگر مجبور نباشم خود را در این زمینه تحمل کنم ...

دوباره ، HARD PASS.

5. نوشتن بیانیه هدف

همانطور که در بالا اشاره کردم ، از مهارت های نوشتاری خود اطمینان چندانی ندارم.

یادداشت جانبی: من کاملاً مطمئن هستم که من از کلاس زبان انگلیسی کلاس 10 خود PTSD دارم زیرا معلم من هرگز از ذکر این نکته که خطاهای من همه مربوط به ESL است (اما برای ضبط کنید ، من همیشه در تمام کلاسهای انگلیسی خود بسیار خوب کار کرده ام) !!

من بیانیه هدف خود را آنقدر بار دیگر اصلاح کردم که حتی نمی توانم حساب کنم. همچنین ، در ابتدا من تفاوت بین یک اظهارنظر شخصی و یک اظهارنظر را نمی دانستم. وقتی فهمیدم ، آن را خراب کردم.

من در ابتدا سخت تلاش کردم تا همه چیزهایی را که از دوران دانشجویی آموخته ام/تجربه کرده ام به دلیل درخواستم برای برنامه های تحصیلات تکمیلی علوم کامپیوتر متصل کنم.

به عنوان مثال ، من مجبور بودم به نحوی توضیح دهم که چگونه سابقه زیست شناسی ، مطالعات بین المللی و تحقیقات بالینی مرا به خوبی برای دانشگاه ها آماده کرده استعلوم کامپیوتر. این کار بسیار به فکر (در مورد دیگران مطمئن نیستم اما باز هم ، این تجربه من است) و تلاش زیادی بود. اما سرانجام ، با کمک دیگران ، من توانستم طوفان فکری زیادی در زمینه های مختلف داشته باشم! ​​

مطمئنم که این مطلب را در بسیاری از پست ها در رابطه با درخواست برای مدارس مقطع دکتری خواهید خواند ، اما مطمئن شوید که در مورد برنامه (اعم از استاد ، کلاس یا جنبه ای از برنامه که واقعاً به آن علاقه دارید) تحقیق کنید و در مورد اینکه چگونه می تواند برای شما مفید باشد صحبت کنید.

من همچنین از ویرایش جسیکا یون بسیار سود بردم. خدمات. خدمات او بیش از حد عالی بود و او در هنگام نوشتن SOP به من اعتماد به نفس داد. او بسیار واجد شرایط است - اما مهمتر از همه ، او از راه دور و سریع با شما کار خواهد کرد.

بنابراین ، به طور خلاصه هر توصیه ای که از تجربه شخصی من حاصل شده است:

مطمئن شوید که کدام مقاله را می دانید برای نوشتن! زمان کافی برای نوشتن مقاله خود بگذارید طوفان فکری نظرات/ویرایش های زیادی را از افراد نپرسید زیرا هرکس نظرات متفاوتی خواهد داشت و ایده ها و خیلی سریع می تواند دیوانه کننده شود.

6. فرآیند درخواست اگر می توانم روی یک چیز تأکید کنم: *مطمئن شوید که توصیه های خود را پیشاپیش خوب نوشته اید *.

با اساتید خود تماس بگیرید (مهم این است که اکثریت از اساتید CS هستند) که فکر می کنید شما را بیشتر می شناسند در محیط دانشگاهی اگر به درستی به خاطر دارم ، سه ماه قبل از اساتیدم (همه اساتید از کلاسهای پیش نیازم تا بتوانند مرا بخاطر بسپارند) خواستم و حداکثر یک هفته قبل پیوندهای توصیه ای را برای آنها ارسال کردم.

در واقع ممکن است یک هفته آن را تحت فشار قرار دهد (من می گویم که دو مورد در امن هستند) اما یکی از مواردی که برای برخی از مدارس متوجه نشدم این است که شما باید بخشی از فرایند درخواست خود را به پایان برسانید تا سیستم ارسال شود پیوندهای توصیه به اساتید !! پس آگاه باشید!

آیا شما جدی

اگر من می تواند خلاصه شود:

با هر یک از اساتید CS تماس بگیرید که شما را به خوبی به خاطر خواهند آورد و از آنها پیشاپیش نامه های توصیه ای بخواهید مطمئن شوید که حداقل آدرس ایمیل آنها را دارید. سیستم برنامه ممکن است شماره تلفن و آدرس را بخواهد اما من هیچ مشکلی نداشتم فقط اطلاعات بخش مربوطه را که مربوط به آنها بود ، کنار بگذارم. اگر آنها خود را تسلیم نکرده اند ، آنها را پیگیری کنید. توصیه ها اگر آنها این کار را نکنند ، می تواند بر درخواست شما تأثیر بگذارد !! پس از پایان فرآیند ، صرف نظر از نتیجه آن ، از آنها سپاسگزاریم. آنها وقت خود را صرف نوشتن چیزهای زیبا در مورد شما کردند که می تواند آینده شما را تغییر دهد.

7. تصمیمات

[فهرست مدارسی که من به آنها مراجعه کردم] براون - رد شده NYU - پذیرفته شده جان هاپکینز - پذیرفته شده UT Austin - رد شد کلمبیا - رد شد

در اصل ، من فقط در دو برنامه شرکت کردم. اما در پایان ، من واقعاً فکر نمی کردم که قرار است به جایی بروم ، بنابراین خوشحال بودم که حداقل به جایی رسیدم. من حتی رقص شاد را انجام دادم.

بدیهی است ، برنامه هایی که من وارد آن نشدم رتبه بالاتری داشتند اما هنوز نمی دانمدلایلی که باعث شد در برخی برنامه ها شرکت کنم و برای برخی دیگر این کار را نکردم. من می توانم یک میلیون دلیل برای اینکه مانند تجربه ناکافی ، معدل متوسط ​​، SOP متوسط ​​، و لیست ادامه دارد ، حدس بزنم ، اما هرگز نمی دانم. من سعی کردم در مراحل برنامه به GradCafe مراجعه کنم اما احساس نمی کردم که اینقدر آموزنده باشد.

EH

به هر حال ، من تصمیم گرفتم NYU را در مورد هاپکینز انتخاب کنم زیرا معتقد بودم که در شهر نیویورک فرصت های فناوری بهتر یا بیشتر برایم فراهم می شود و من واقعاً از این واقعیت که برنامه در مقابل 1.5 سال هاپکینز ، 2 سال کامل بود. مشخصات جمعیتی هر دو مدرسه تقریباً مشابه بود و حتی اگر میزان اشتغال پس از فارغ التحصیلی برای من بسیار مهم بود ، این اطلاعات از آنها در دسترس نبود ... (و من هنوز مطمئن نیستم چرا).

پف ، متأسفم برای پست طولانی اما امیدوارم تا حدودی مفید /آموزنده بوده باشد. من می دانم که این بسیار طاقت فرسا است و ممکن است این فرآیند دلهره آور به نظر برسد ، اما اگر من بتوانم این کار را انجام دهم ، شما نیز می توانید! اگر س questionsالی دارید ، لطفاً در زیر نظر دهید و منتظر بازخورد هستم :)

allthegifswereprovidedbygiphy.com

من مهندسی برق و کامپیوتر می خوانم. به من C ، C ++ و جاوا از طریق دوره های دانشگاهی آموزش داده شده است.

من مهندسی برق و کامپیوتر می خوانم. به من C ، C ++ و جاوا از طریق دوره های دانشگاهی آموزش داده شده است.

تا تابستان گذشته هیچگونه لینوکس یا اطلاعات infosec نداشتم. من با یادگیری پایتون با کتاب "پایتون را از راه سخت بیاموزید" را شروع کردم.

سپس به مطالعه کتابهای تخصصی تر پرداختم ، در حالی که منابع آنلاین را مرور می کردم و چیزهایی را که با بازی های جنگی یاد می گرفتم تمرین می کردم مانند http: //overthewire.org

خواندن پیشنهادی:

هک: هنر بهره برداری ، چاپ دوم هک کردن هنر حل مسئله خلاق است ، خواه به معنای یافتن راه حلی غیر متعارف برای یک مشکل ... www.amazon.com پایتون خشونت آمیز: کتاب آشپزی برای هکرها ، تحلیلگران قانونی ، آزمایش کنندگان نفوذ و امنیت… ITIL 2011 در یک نگاه ITIL در سراسر جهان در حال پیاده سازی ITIL [ثبت شده] به عنوان وسیله ای برای بهبود فناوری اطلاعات می باشد ... www.amazon.de کلاه سیاه پایتون | بدون نشاسته پرس جاستین سیتز یک محقق امنیتی ارشد برای Immunity، Inc است ، جایی که او وقت خود را صرف شکار اشکالات می کند ، معکوس ... www.nostarch.com