Canon вдигна много шум за новата си система за дълбоко обучение AF, която е в основата на най-новата водеща професионална камера на производителя. Звучи невероятно умно, но има много въпроси - какво е Deep Learning? Кой преподава? Системата учи ли се, докато снимате? Наистина ли това е изкуствен интелект в камера? Подобрява ли всъщност автофокуса?
Ако сте прочели нашия преглед на Canon EOS-1D X Mark III, ще знаете, че отговорът на последния въпрос е категорично да. Що се отнася до отговорите на другите въпроси относно дълбокото обучение AF, вземете си питие и лека закуска и прочетете нататък …
Механиката на автофокуса на Canon EOS-1D X Mark III е невероятно интелигентна, поддържайки две отделни AF системи. Първата е оптичната система, която заснема 16 кадъра в секунда през визьора, използвайки измервателен сензор от 400 000 пиксела заедно със специален процесор Digic 8, за 191-точков AF с възможност за проследяване на лица.
След това има системата Live View, която може да заснема 20 кадъра в секунда, използвайки всичките 20,1 милиона пиксела от сензора за изображения, комбинирани с новия процесор Digic X, за 3869 Dual Pixel CMOS точки, които могат да извършват AF с пълно разпознаване на очите.
Захранването на двете системи е основната технология EOS iTR AFX на Canon - най-новата итерация на нейния интелигентен автофокус за проследяване и разпознаване, който дебютира в оригиналния EOS-1D X (и впоследствие направи своя път към семействата 7D Mark II и 5D). И погребан в неговата схема е алгоритъмът за дълбоко обучение.
Дълбокото обучение НЕ е същото като AI
На първо място, важно е да се изясни, че Дълбокото обучение не трябва да се бърка с изкуствения интелект (ИИ). AI системата е нещо, което е в процес на непрекъснато развитие. Дълбокото обучение или машинното обучение е подмножество на ИИ.
За разлика от истинския ИИ, дълбокото обучение е затворен процес. Това е алгоритъм за предварително сглобяване, който позволява на архитектурата на камерата да се обучава по същество, много по-бързо, отколкото би могло да бъде програмирано ръчно от човешки инженери. След като това обучение е завършено, то се заключва и зарежда в камерата.
От този момент не е възможно повече учене; въпреки името - и Deep Learning е името на технологията, а не описание на процеса - камерата не се учи постоянно и няма да стане „по-добра“, колкото повече снимате (наистина, истинската система за ИИ би научила толкова много на вашите лоши навици, както и на вашите добри!).
„Това е научено“, обяснява Майк Бърнхил, мениджър за техническа поддръжка на Canon Europe. "Поставяте го в компютър, той създава алгоритъма, който след това се зарежда в камерата. Така че той е различен от AI - AI е непрекъснато обучение; дълбокото обучение е основно, той се самообучава и ви дава краен резултат, който след това се зарежда в камерата. "
Което поражда въпроса: с толкова много компании, които крещят за функции, базирани на ИИ, камерата всъщност може ли да поддържа изкуствен интелект?
„Мощността за обработка на истински AI не е осъществима във фотоапарат“, казва Burnhill. "Ако искате да направите това, има телефони - но данните не са във вашия телефон, а в Силициевата долина. Това е мястото, където е системата за изкуствен интелект. Просто, вашата телефонна връзка се свързва с нея - не е тук, а там (в облакът), защото имате нужда от сървър. Можем да направим камера, но вие непрекъснато ще държите гигантски случай на полет с вас. "
Как се преподава дълбокото обучение?
И така, алгоритъмът за дълбоко обучение се обучава сам - но откъде всъщност се учи? Отговорът, казано по-просто, е „от най-добрите“.
„Canon е работил с нашите агенции“, казва ни Бърнхил. „Получихме основно достъп до цялата им база данни със спортни снимки от всички основни агенции, работихме с нашите посланици, които снимат спорт, и те предоставиха своите изображения на различни обекти, и това ни позволи да научим тази AF система как да разпознава хора в спорта. "
Очевидно спортът е целевият метод на обучение, тъй като Canon EOS-1D X Mark III е предимно спортна камера. Проблемът е, независимо дали става въпрос за баскетболист, обърнат встрани от камерата, скиор с очила или пилот от Формула 1, носещ каска, хората в спорта често имат затъмнени лица - което означава, че традиционното AF или дори откриване на очи AF не работи и камерата вместо това ще заключи неща като числата на униформата на играча.
Предоставяйки на алгоритъма за дълбоко обучение достъп до огромна библиотека от изображения, от всичко - от обърнати надолу гимнастички до хокеисти, носещи подложки и каски, той е в състояние да научи и разграничи човешката форма в безкрайно разнообразие от ситуации - и в крайна сметка е в състояние за да извършите това „откриване на главата“, така че дори лицето на човека да не се вижда, главата винаги е основната точка на фокус.
„Дълбокото обучение в основата си има изображения, вие създавате набор от правила, по които да се учи, и след това излиза и създава свой собствен алгоритъм,“ продължава Burnhill. "Така че вие задавате параметрите на това как би изглеждал човекът, вие отивате," Ето го човекът ", след това анализира всички образи на хора и казва:" Това е човек "," Това е човек ". преминава през милиони изображения за определен период от време и създава тази база данни и тя се учи сама. "
Всъщност алгоритъмът всъщност създава две бази данни - едната за обслужване на системата за автоматично фокусиране на оптичния визьор и измерване, използвайки Digic 8, и една за обслужване на системата за автоматично гледане на Live View, която използва Digic X. Тъй като Digic X прави всички изчисления за проследяване на главата, след като AF алгоритъмът открие човек в кадъра, всичко се прехвърля към новия процесор.
„След като въведете човек, всъщност се извършва двойна обработка“, казва Бърнхил. "Тук има две бази данни, тъй като входът от двата сензора ще бъде малко по-различен, така че начина, по който се разпознава, ще бъде малко по-различен, така че това са подмножества на един и същ алгоритъм. Основните данни и за двата са еднакви, просто как ще бъде разпознат и правилните данни, приложени към него. "
Ако не може да научи нови неща … какво ще кажете за животинския АФ?
Разбира се, Canon EOS-1D X Mark III не е просто спортна камера - другата му ключова аудитория са стрелците от дивата природа. И все пак камерата не притежава възможност за автофокус на животни и ние установихме, че Deep Learning всъщност не може да научи нови трикове, след като бъде изпечен в камерата. И така ли? С цялата тази изискана нова технология камерата дори няма ли да се фокусира върху семейното куче?
Вярно е, че в момента камерата не разполага с животинско (или животинско око) AF. „По принцип се концентрираме върху хората, с които да започнем, за да накараме този алгоритъм да работи първо“, отговаря Бърнхил. „Ето защо сме се съсредоточили върху спорта, защото това е зададен параметър и можем да го преподаваме в определен период от време,“
Тогава отговорът се крие във фърмуера. Burnhill потвърди, че има потенциал камерата да се подложи на по-задълбочено обучение, за неща като птици и диви животни и този актуализиран алгоритъм да бъде разпространен сред потребителите чрез актуализации на фърмуера - въпреки че няма конкретни планове за обявяване.
"Ще го разработваме през цялото време, така че в момента все още не е решено как и къде да отидем. Но екипът за разработки отива и разглежда други животински снимки - ние осъзнаваме, че има цял куп полета, но очевидно големите фокусът на тази камера е спортът, а след това и дивата природа и очевидно с Токио 2022-2023 това беше приоритетът. "
Това е справедлива точка; ако Canon чакаше Deep Learning да научи всичко, камерата щеше да отнеме повече време. И въпреки че производители като Sony могат да се похвалят с някои селективни AF за животни в своите камери, Burnhill отбелязва, че Canon много по-скоро ще пусне цялостно решение за AF за животни, а не селективно, на части. И тук дълбокото обучение ще стане безценно.
"Проблемът е с дивата природа, има много различни животни - очевидно имате хищници с очите отпред, а след това имате зайци (очите) отстрани, имате змии, имате птици … няма система, която разпознава лицата на всички животни. И там вие навлизате в цялото това Дълбоко обучение, в обучението на системата да разпознава тези сложни неща. "
И така, докато вашият Sony може да е в състояние да проследява вашето куче или вашата котка, но не и саламандър или фламинго, Canon иска да произведе камера, която прави всичко или нищо. „Ако щяхме да го направим, бихме искали да го направим с възможно най-широк спектър - не искаме да правим камера, подходяща за кучета и камера, подходяща за котки, искаме да направим камера, подходяща за животни което работи за широк кръг животни, които (професионалистите) биха отстреляли. "
Преглед на Canon EOS-1D X Mark III
Как Canon направи най-бързия DSLR някога? Чрез препроектиране на огледалната кутия
102 актуализации на Canon EOS-1D X Mark III