Квазиньютоновские методы
Квазиньютоновские методы — методы оптимизации, основанные на накоплении информации о кривизне целевой функции по наблюдениям за изменением градиента, чем принципиально отличаются от ньютоновских методов. Класс квазиньютоновских методов исключает явное формирование матрицы Гессе, заменяя её некоторым приближением.
Описание
Разложим градиент исходной функции в ряд Тейлора в окрестности точки очередного приближения
по степеням следующего шага алгоритма
:
Тогда оценка матрицы Гессе должна удовлетворять равенству:
,
где
это условие называют квазиньютоновским.
На каждой итерации с помощью определяется следующее направление поиска
, и матрица
обновляется с учётом вновь полученной информации о кривизне:
,
где — матрица, характеризующая поправку, вносимую на очередном шаге.
В качестве начального приближения кладут единичную матрицу, таким образом первое направление
будет в точности совпадать с направлением наискорейшего спуска.
Поправка единичного ранга
Один шаг алгоритма даёт информацию о кривизне вдоль одного направления, поэтому ранг матрицы полагают малым, и даже единичным:
где и
некоторые вектора.
Тогда, квазиньютоновское условие примет вид:
Полагая, что предыдущая матрица на очередном шаге квазиньютоновскому условию не удовлетворяет (т.е. разность в правой части не равна нулю), и что вектор
не ортогонален
, получают выражение для
и
:
Из соображений симметричности матрицы Гессе, вектор берут коллинеарным
:
Полученное уравнение называется симметричной формулой ранга один.
Поправки ранга два
Один из способов конструирования поправок ранга два заключается в построении сходящейся последовательности матриц . В качестве начального значения
берут
,
вычисляют по формуле:
После чего её симметризуют:
Однако полученная матрица больше не удовлетворяет квазиньютоновскому условию. Чтобы это исправить, процедуру повторяют. В результате на -м шаге:
Предел этой последовательности равен:
При выборе различных (не ортогональных
) получаются различные формулы пересчёта матрицы
:
приводит к симметричной формуле ранга один;
приводит к симметричной формуле Пауэлла — Бройдена (PSB);
приводит к симметричной формуле Девидона — Флетчера — Пауэлла (DFP):
,
где
Нетрудно проверить, что ортогонален
. Таким образом добавление слагаемого
не нарушит ни квазиньютоновского условия, ни условия симметричности. Поэтому проводился ряд теоретических исследований, подвергавших последнее слагаемое масштабированию на предмет получения наилучшего приближения. В результате была принята точка зрения, что наилучшим вариантом является отвечающий полному отсутствию последнего слагаемого. Этот вариант пересчёта известен под именем формулы Бройдена — Флетчера — Гольдфарба — Шанно (BFGS):
Литература
- Гилл Ф., Мюррей У., Райт М. Практическая оптимизация = practical optimization.
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Квазиньютоновские методы, Что такое Квазиньютоновские методы? Что означает Квазиньютоновские методы?
Kvazinyutonovskie metody metody optimizacii osnovannye na nakoplenii informacii o krivizne celevoj funkcii po nablyudeniyam za izmeneniem gradienta chem principialno otlichayutsya ot nyutonovskih metodov Klass kvazinyutonovskih metodov isklyuchaet yavnoe formirovanie matricy Gesse zamenyaya eyo nekotorym priblizheniem OpisanieRazlozhim gradient g x k displaystyle vec g vec x k ishodnoj funkcii v ryad Tejlora v okrestnosti tochki ocherednogo priblizheniya x k displaystyle vec x k po stepenyam sleduyushego shaga algoritma s k displaystyle vec s k g x k s k g x k G x k s k displaystyle vec g vec x k vec s k approx vec g vec x k G vec x k vec s k dd Togda ocenka matricy Gesse Bk 1 displaystyle B k 1 dolzhna udovletvoryat ravenstvu Bk 1s k y k displaystyle B k 1 vec s k vec y k dd gde y k g x k s k g x k displaystyle vec y k vec g vec x k vec s k vec g vec x k eto uslovie nazyvayut kvazinyutonovskim Na kazhdoj iteracii s pomoshyu Bk displaystyle B k opredelyaetsya sleduyushee napravlenie poiska p k displaystyle vec p k i matrica B displaystyle B obnovlyaetsya s uchyotom vnov poluchennoj informacii o krivizne Bkp k g x k displaystyle B k vec p k vec g vec x k dd Bk 1 Bk Uk displaystyle B k 1 B k U k dd gde Uk displaystyle U k matrica harakterizuyushaya popravku vnosimuyu na ocherednom shage V kachestve nachalnogo priblizheniya B0 displaystyle B 0 kladut edinichnuyu matricu takim obrazom pervoe napravlenie p 0 displaystyle vec p 0 budet v tochnosti sovpadat s napravleniem naiskorejshego spuska Popravka edinichnogo ranga Odin shag algoritma dayot informaciyu o krivizne vdol odnogo napravleniya poetomu rang matricy Uk displaystyle U k polagayut malym i dazhe edinichnym Bk 1 Bk u v T displaystyle B k 1 B k vec u vec v T dd gde u displaystyle vec u i v displaystyle vec v nekotorye vektora Togda kvazinyutonovskoe uslovie primet vid Bk u v T s k y k displaystyle B k vec u vec v T vec s k vec y k dd u v Ts k y k Bks k displaystyle vec u vec v T vec s k vec y k B k vec s k dd Polagaya chto predydushaya matrica Bk displaystyle B k na ocherednom shage kvazinyutonovskomu usloviyu ne udovletvoryaet t e raznost v pravoj chasti ne ravna nulyu i chto vektor v displaystyle vec v ne ortogonalen s k displaystyle vec s k poluchayut vyrazhenie dlya u displaystyle vec u i Bk 1 displaystyle B k 1 u 1v Ts k y k Bks k displaystyle vec u frac 1 vec v T vec s k vec y k B k vec s k dd Bk 1 Bk 1v Ts k y k Bks k v T displaystyle B k 1 B k frac 1 vec v T vec s k vec y k B k vec s k vec v T dd Iz soobrazhenij simmetrichnosti matricy Gesse vektor v displaystyle vec v berut kollinearnym u displaystyle vec u Bk 1 Bk 1 y k Bks k Ts k y k Bks k y k Bks k T displaystyle B k 1 B k frac 1 vec y k B k vec s k T vec s k vec y k B k vec s k vec y k B k vec s k T dd Poluchennoe uravnenie nazyvaetsya simmetrichnoj formuloj ranga odin Popravki ranga dva Odin iz sposobov konstruirovaniya popravok ranga dva zaklyuchaetsya v postroenii shodyashejsya posledovatelnosti matric B j displaystyle B j V kachestve nachalnogo znacheniya B 0 displaystyle B 0 berut Bk displaystyle B k B 1 displaystyle B 1 vychislyayut po formule B 1 B 0 1v Ts k y k B 0 s k v T displaystyle B 1 B 0 frac 1 vec v T vec s k vec y k B 0 vec s k vec v T dd Posle chego eyo simmetrizuyut B 2 B 1 B 1 T2 displaystyle B 2 frac B 1 B 1 T 2 dd Odnako poluchennaya matrica bolshe ne udovletvoryaet kvazinyutonovskomu usloviyu Chtoby eto ispravit proceduru povtoryayut V rezultate na j displaystyle j m shage B 2j 1 B 2j 1v Ts k y k B 2j s k v T displaystyle B 2j 1 B 2j frac 1 vec v T vec s k vec y k B 2j vec s k vec v T B 2j 2 B 2j 1 B 2j 1 T2 displaystyle B 2j 2 frac B 2j 1 B 2j 1 T 2 dd Predel etoj posledovatelnosti raven Bk 1 Bk 1v Ts k y k Bks k v T v y k Bks k T y k Bks k Ts k v Ts k 2v v T displaystyle B k 1 B k frac 1 vec v T vec s k vec y k B k vec s k vec v T vec v vec y k B k vec s k T frac vec y k B k vec s k T vec s k vec v T vec s k 2 vec v vec v T dd Pri vybore razlichnyh v displaystyle vec v ne ortogonalnyh s k displaystyle vec s k poluchayutsya razlichnye formuly pereschyota matricy B displaystyle B v y k Bks k displaystyle vec v vec y k B k vec s k privodit k simmetrichnoj formule ranga odin v s k displaystyle vec v vec s k privodit k simmetrichnoj formule Pauella Brojdena PSB v y k displaystyle vec v vec y k privodit k simmetrichnoj formule Devidona Fletchera Pauella DFP Bk 1 Bk 1s kTBks kBks ks kTBkT 1y kTs ky ky kT s kTBks k w kw kT displaystyle B k 1 B k frac 1 vec s k T B k vec s k B k vec s k vec s k T B k T frac 1 vec y k T vec s k vec y k vec y k T vec s k T B k vec s k vec omega k vec omega k T dd gde w k 1y kTs ky k 1s kTBks kBks k displaystyle vec omega k frac 1 vec y k T vec s k vec y k frac 1 vec s k T B k vec s k B k vec s k Netrudno proverit chto w k displaystyle vec omega k ortogonalen s k displaystyle vec s k Takim obrazom dobavlenie slagaemogo w kw kT displaystyle vec omega k vec omega k T ne narushit ni kvazinyutonovskogo usloviya ni usloviya simmetrichnosti Poetomu provodilsya ryad teoreticheskih issledovanij podvergavshih poslednee slagaemoe masshtabirovaniyu na predmet polucheniya nailuchshego priblizheniya V rezultate byla prinyata tochka zreniya chto nailuchshim variantom yavlyaetsya otvechayushij polnomu otsutstviyu poslednego slagaemogo Etot variant pereschyota izvesten pod imenem formuly Brojdena Fletchera Goldfarba Shanno BFGS Bk 1 Bk 1s kTBks kBks ks kTBkT 1y kTs ky ky kT displaystyle B k 1 B k frac 1 vec s k T B k vec s k B k vec s k vec s k T B k T frac 1 vec y k T vec s k vec y k vec y k T dd LiteraturaGill F Myurrej U Rajt M Prakticheskaya optimizaciya practical optimization
