თუ თქვენ ხედავთ ამ შეტყობინებას, ესე იგი საიტზე გარე რესურსების ჩატვირთვისას მოხდა შეფერხება.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

ძირითადი მასალა

ლაგრანჟის მამრავლები, შესავალი

„ლაგრანჟის მამრავლების" ტექნიკა არის შეზღუდული ოპტიმიზაციის ამოცანების ამოხსნის გზა.  ძალიან გამოსადეგი!

რის აგებას ვცდილობთ:

  • ლაგრანჟის მამრავლის მეთოდი საშუალებას გვაძლევს, ვიპოვოთ მრავალცვლადიანი f(x,y,) ფუნქციის მაქსიმუმი ან მინიმუმი, სადაც არგუმენტის შესაძლო გამოსაყენებელ მნიშვნელობებზე რაიმე შეზღუდვაა.
  • ეს მეთოდი შეესაბამება მხოლოდ ისეთ შეზღუდვებს, რომლებიც დაახლოებით ასე გამოიყურება:
    g(x,y,)=c
    აქ g არის სხვა მრავალცვლადიანი ფუნქცია არგუმენტის იმავე სივრცით (განსაზღვრის იმავე არით), რაც - f და c რაიმე მუდმივაა.
  • საკვანძო იდეაა ისეთი წერტილების ძებნა, სადაც f-ისა და g-ის კონტურული ხაზები ერთმანეთს ეხება.
  • ეს იგივეა, რაც ისეთი წერტილების მოძებნა, სადაც f-ისა და g-ის გრადიენტული ვექტორები ერთმანეთის პარალელურებია.
  • მთელი პროცესი შეგვიძლია, მოვაქციოთ კონკრეტული ფუნქციის, რომელსაც ლაგრანჟიანი ეწოდება, გრადიენტის ნულოვანი ვექტორისთვის გატოლებაში.

სამოტივაციო მაგალითი

დავუშვათ, გინდათ შემდეგი ფუნქციის მაქსიმიზაცია:
f(x,y)=2x+y
f(x,y)=2x+y ფუნქციის გრაფიკი
მაგრამ ასევე დავუშვათ, რომ საკუთარ თავს შეზუღდვა დაუწესეთ ისეთი (x,y) არგუმენტებით, რომლებიც შემდეგ განტოლებას აკმაყოფილებს:
x2+y2=1
ყველა (x,y) წერტილი, რომელიც აკმაყოფილებს x2+y2=1-ს, ასევე ცნობილია, როგორც - ერთეულოვანი წრე.
სხვა სიტყვებით რომ ვთქვათ, ერთეულოვანი წრის რომელ (x,y) წერტილზეა 2x+y-ის მნიშვნელობა უდიდესი?
ეს ცნობილია შეზღუდული ოპტიმიზაციის ამოცანად. წერტილების შეზღუდვას, სადაც x2+y2=1 ეწოდება „შეზუდვა“ და f(x,y)=2x+y არის ფუნქცია, რომელსაც ოპტიმიზაცია სჭირდება.
აქ ამის ვიზუალიზაციის ერთი გზაა: ჯერ დავხაზოთ f(x,y)-ის გრაფიკი, რომელიც ჰგავს დახრილ სიბრტყეს, რადგან f წრფივია. შემდეგ x2+y2=1 წრის პროეცირება მოახდინეთ xy სიბრტყიდან ვერტიკალურად f-ის გრაფიკზე. მაქსიმუმი, რომელსაც ვეძებთ, შეესაბამება გრაფიკზე ამ პროეცირებული წრის უმაღლეს წერტილს.
ხანის აკადემიის ვიდეოების მომთავსებელი

უფრო ზოგადი ფორმა

ზოგადად, შეზღუდული ოპტიმიზაციის ამოცანები მოიცავს მრავალცვლადიანი ფუნქციის, რომელის არგუმენტსაც აქვს ნებისმიერი ოდენობის განზომილება, მაქსიმიზაცია/მინიმიზაციას:
f(x,y,z,)
თუმცა მისი მნიშვნელობა ყოველთვის ერთგანზომილებიანი იქნება, რადგან ვექტორული მნიშვნელობებისთვის არ არსებობს „მაქსიმუმობის“ ცხადი ჩანაწერი.
შეზღუდვების ტიპმა, რომელსაც ლაგრანჟის მამრავლის მეთოდი იყენებს, უნდა მიიღოს რაიმე სხვა მრავალცვლადიანი g(x,y,z,) ფუნქციის ფორმა, რომელიც უტოლდება c შეზღუდვას.
g(x,y,z,)=c
რადგან ეს უნდა იყოს შეზღუდვა f-ის არგუმენტზე, g-ის არგუმენტის განზომილებების რაოდენობა იგივეა, რაც - f-ის. მაგალითად, ზემოთ შემოსაზღვრული მაგალითი შეესაბამება ამ ზოგად ფორმას შემდეგნაირად:
f(x,y)=2x+y
g(x,y)=x2+y2
c=1

კონტურული რუკების გამოყენება

ამ ამოცანაზე მსჯელობა მარტივდება, თუ f-ს გამოვსახავთ არა გრაფიკით, არამედ - მისი კონტურული ხაზებით.
შეგახსენებთ, რომ f(x,y)-ის კონტურული ხაზი არის ყველა წერტილის ერთობლიობა, სადაც f(x,y)=k რაიმე მუდმივი k-სთვის. შემდეგი ინტერაქტიული ინსტრუმენტი გვიჩვენებს, ეს ხაზი (ლურჯად დახაზული) როგორ იცვლება, როცა k მუდმივი იცვლება. g(x,y)=1 წრე ნაჩვენებია (წითლად). სცადეთ, k მაქსიმალურად დიდი/პატარა გახადოთ ისე, რომ f-ის კონტურული ხაზი კვლავ კვეთდეს წრეს.
კონცეფციის შემოწმება: რას ნიშნავს, თუ k-ს კონკრეტული მნიშვნელობისთვის, ლურჯი ხაზი, რომელიც წარმოადგენს f(x,y)=k-ს, არ კვეთს წითელ წრეს, რომელიც წარმოადგენს g(x,y)=1-ს?
აირჩიეთ 1 პასუხი:

შენიშნეთ, რომ წრე, სადაც g(x,y)=1-ზე შეგვიძლია, ვიფიქროთ, როგორც - g ფუნქციის კონკრეტულ კონტურულ ხაზზე. ასე რომ, აქ არის შეზღუდული ოპტიმიზაციის ამოცანაზე ფიქრის ჭკვიანური გზა:
საკვანძო დაკვირვება: f-ის მაქსიმალური და მინიმალური მნიშვნელობები g(x,y)=1 შეზღუდვის გათვალისწინებით, შეესაბამება f-ის იმ კონტურულ ხაზებს, რომლებიც არის იმ კონტურის მხები, რომელიც წარმოადგენს g(x,y)=1-ს.
f განსხვავებული ფუნქცია რომ იყოს, მისი კონტურები ყოველთვის სწორი ხაზები შეიძლება, არ იყოს. ეს ამ მაგალითში გვაქვს, რადგან f წრფივია. მაგალითად, შეხედეთ ამ ფუნქციას:
f(x,y)=2x2+5y,
ეს კონტურული წრფეები ასე გამოიყურება:
თუმცა საკვანძო დაკვირვება კვლავ სრულდება და უნდა აღინიშნოს: როცა k არის f-ის მაქსიმუმი ან მინიმუმი რაიმე შეზღუდვის გათვალისწინებით, f(x,y)=k-ის კონტურული ხაზი იქნება იმ კონტურის მხები, რომელიც წარმოადგენს g(x,y)=1-ს.

როდის შემოდის გრადიენტი

როგორ გამოხატავთ იმ აზრს, რომ ორი კონტურული ხაზი მხებია, ფორმულაში?
ამას რომ ვუპასუხოთ, ჩვენ ვუბრუნდებით ერთგულ მეგობარს, გრადიენტს. f-ის ინტერპრეტირების ბევრი გზა არსებობს: ყველაზე ციცაბო დახრილობის მიმართულება, მიმართულებითი წარმოებულების გამოთვლის ინსტრუმენტი და ა.შ. მაგრამ აქ, ჩვენი მიზნებისთვის, თვისება, რომელიც გვაინტერესებს, არის, რომ: f-ის (x0,y0) წერტილზე გამოთვლილი გრადიენტი გვაძლევს ვექტორს, რომელიც მართობულია ამ წერტილზე გამავალი კონტურული ხაზისა.
ეს იმას ნიშნავს, რომ, როცა ორი ფუნქციის, f-ისა და g-ის, კონტურული ხაზები ეხება, მათი გრადიენტული ვექტორები პარალელურია. აი, როგორ შეიძლება, ისინი გამოიყურებოდეს, როგორც - f-ისა და g-ის ზოგადი ფუნქციები:
ის ფაქტი, რომ კონტურული ხაზები ეხება, არაფერს გვეუბნება თითოეული გრადიენტული ვექტორის აბსოლუტური მნიშვნელობის შესახებ, მაგრამ ამას არა უშავს. როცა ორი ვექტორი ერთ მხარესაა მიმართული, ეს ნიშნავს, რომ ერთი შეგვიძლია, გავამრავლოთ რაიმე მუდმივზე, რომ მეორე მივიღოთ. კონკრეტულად, დავუშვათ, რომ (x0,y0) წარმოადგენს კონკრეტულ წერტილს, სადაც f-ისა და g-ის კონტურული ხაზები ეხება (x0-სა და y0-ში 0-იანი ნიშნავს, რომ ჩვენ განვიხილავთ მუდმივ მნიშვნელობებს, შესაბამისად, კონკრეტულ წერტილს). რადგან ეს შეხება ნიშნავს, რომ მათი გრადიენტები თანხვედრადაა მიმართული, შეგიძლიათ, ეს დაწეროთ:
f(x0,y0)=λ0g(x0,y0)
აქ λ0 წარმოადგენს რაიმე მუდმივას. ზოგიერთი ავტორი იყენებს უარყოფით მუდმივას, λ0-ს, მაგრამ მე დადებითი მუდმივას გამოყენება მიჩვენია, რადგან იგი შემდეგ უფრო ნათელ ინტერპრეტაციას λ0 გვაძლევს.
მოდით, ვნახოთ ეს როგორ გამოიყურება ჩვენს მაგალითში, სადაც f(x,y)=2x+y და g(x,y)=x2+y2. f-ის გრადიენტი არის
f(x,y)=[x(2x+y)y(2x+y)]=[21]
და g-ის გრადიენტია
g(x,y)=[x(x2+y21)y(x2+y21)]=[2x2y]
შესაბამისად, შეხების პირობა საბოლოოდ შემდეგნაირად გამოიყურება:
[21]=λ0[2x02y0]

ამოცანის ამოხსნა კონკრეტულ შემთხვევაში

რომ შევაჯამოთ, ვეძებთ (x0,y0)-ის არგუმენტის წერტილებს შემდეგი თვისებებით:
  • g(x0,y0)=1, რაც ჩვენ მაგალითში ნიშნავს:
    x02+y02=1
  • f(x0,y0)=λ0g(x0,y0) რაიმე λ0 მუდმივასთვის, რაც ჩვენს მაგალითში ნიშნავს შემდეგს:
    2=2λ0x01=2λ0y0
გვაქვს 3 განტოლება და 3 უცნობი, ასე რომ, ეს შესანიშნავად ამოხსნადი სიტუაციაა.

ლაგრანჟიანის ფუნქცია

ჯოზეფ ლუი ლაგრანჟი, გამოიყურება ერთდორულოად მშვიდობიანად, წყნარად და მთვლემარედ. Wikimedia Commons
1700-იან წლებში ჩვენმა მეგობარმა ჟოზეფ ლუი ლაგრანჟმა შეისწავლა ასეთი შეზღუდული ოპტიმიზაციის ამოცანა და იპოვა ჭკვიანური გზა, რომ გამოესახა ყველა პირობა ერთ განტოლებაში.
ეს პირობები შეგიძლიათ, ჩაწეროთ ზოგადად იმის თქმით, რომ ვეძებთ x0, y0 და λ0 მუდმივებს, რომლებიც შემდეგ პირობებს აკმაყოფილებს:
  • შეზღუდვა:
    g(x0,y0)=c
  • შეხების პირობა:
    f(x0,y0)=λ0g(x0,y0).
    ეს კომპონენტად შეგვიძლია, შემდეგნაირად დავშალოთ:
  • fx(x0,y0)=λ0gx(x0,y0)
  • fy(x0,y0)=λ0gy(x0,y0)
ლაგრანჟმა დაწერა ახალი განსაკუთრებული ფუნქცია, რომელიც იღებს იმავე არგუმენტ ცვლადებს, როგორიცაა f და g ახალშემოყვანილ λ-სთან ერთად, რომელსაც ახლა ცვლადად უფრო აღვიქვამთ, ვიდრე - მუდმივად.
L(x,y,λ)=f(x,y)λ(g(x,y)c)
მაგალითად, განიხილეთ ზემოთ მოცემული მაგალითი.
f(x,y)=2x+yg(x,y)=x2+y2c=1
აი, როგორ გამოიყურება ახალი ფუნქცია:
L(x,y,λ)=2x+yλ(x2+y21).
შენიშნეთ, რომ L-ის კერძო წარმოებული λ-ის მიმართ არის (g(x,y)c):
Lλ(x,y,λ)=λ(f(x,y)λ(g(x,y)c)=0(g(x,y)c)
ასე რომ, g(x,y)=c პირობა შეგვიძლია, შემდეგნაირად გადავთარგმნოთ
Lλ(x,y,λ)=g(x,y)+c=0
მეტიც, შეხედეთ, რას ვიღებთ, როდესაც ერთ-ერთ სხვა კერძო წარმოებულს ვუტოლებთ 0-ს:
Lx(x,y,λ)=0x(f(x,y)λ(g(x,y)c))=0fx(x,y)λgx(x,y)=0fx(x,y)=λgx(x,y)
ეს ჩვენი ერთ-ერთი სხვა პირობაა! თითქმის იდენტურად, Ly(x,y,λ)=0 პირობა იძლევა შემდეგს:
fy(x,y)=λgy(x,y)
ერთად ეს პირობები იგივეა, რაც - შემდეგის თქმა:
f(x,y)=λg(x,y)
შესაბამისად, სამი პირობა, რომელიც უნდა ამოვხსნათ x,y-ისა და λ-ის საპოვნელად, დადის L-ის კერძო წარმოებულების 0-ისთვის გატოლებაზე. ეს ძალიან კომპაქტურად შეგვიძლია, ჩავწეროთ L-ის გრადიენტის გატოლებით ნულოვანი ვექტორისთვის:
L=0
მაგალითად, ზემოთ მოცემული კონრეტული ფუნქციების გამოყენებით, ვხედავთ, ეს როგორც კოდირდება განტოლებების სისტემაში, რომელიც უნდა ამოვხსნათ:
L=[x(2x+yλ(x2+y21))y(2x+yλ(x2+y21))λ(2x+yλ(x2+y21))]=[22λx12λyx2y2+1]=[000]
ჟოზეფ ლუის საპატივცემულოდ L ფუნქციას ვუწოდებთ „ლაგრანჟიანს“ და შემოტანილ ახალ λ ცვლადს ეწოდება „ლაგრანჟის მამრავლი“. წარმოიდგინეთ, რომ ვინმემ თქვენ გვარს ბოლოში დაუმატა „-იანი“ და გამოიყენა ფუნქციის სახელად, რომელსაც ყველა იყენებს. ალბათ, სასიამოვნოა!
გაფრთხილება: ზოგიერთი ავტორი იყენებს შეთანხმებას, სადაც λ i-ის ნიშანი ბრუნდება:
L(x,y,λ)=f(x,y)+λ(g(x,y)c)
ეს ამოცანის ამოხსნისას არანაირ ცვლილებას არ იწვევს, მაგრამ უნდა გაითვალისწინოთ, რომ ამ კურსის განმავლობაში, მათ შორის შემდეგ ტექსტში, გამოიყენება ეს შეთანხმება.

შეჯამება

სურათის წყარო: Nexcis (საკუთარი ნამუშევარი) [საჯარო საკუთრება], Wikimedia Commons
როცა გინდათ მრავალცვლადიანი f(x,y,) ფუნქციის მაქსიმიზაცია (ან მინიმიზაცია) იმ შეზღუდვის გათვალისწინებით, რომ სხვა მრავალცვლადიანი ფუნქცია უდრის მუდმივას, g(x,y,)=c, მიჰყევით შემდეგ ნაბიჯებს:
  • ნაბიჯი 1: შემოიღეთ ახალი ცვლადი λ და განსაზღვრეთ ახალი ფუნქცია L, როგორც ქვევით არის აღნიშნული:
    L(x,y,,λ)=f(x,y,)λ(g(x,y,)c)
    ამ L ფუნქციას ეწოდება „ლაგრანჟიანი“ და ახალ λ ცვლადს მოიხსენეიბენ „ლაგრანჟის მამრავლად“
  • ნაბიჯი 2: L-ის გრადიენტი გაუტოლეთ ნულოვან ვექტორს.
    L(x,y,,λ)=0ნულოვანი ვექტორი
    სხვა სიტყვებით რომ ვთქვათ, იპოვეთ L-ის კრიტიკული წერტილები.
  • ნაბიჯი 3: განიხილეთ თითოეული ამონახსნი, რომლებიც დაახლოებით (x0,y0,,λ0) ფორმის იქნება. თითოეული მათგანი ჩასვით f-ში. ან ჯერ მოაშორეთ λ0 კომპონენტი და შემდეგ ჩასვით f-ში, რადგან f-ს არ აქვს λ არგუმენტად. რომელი მათგანიც მოგცემთ უდიდეს (ან უმცირეს) მნიშვნელობას, არის საძიებელი მაქსიმუმის (ან მინიმუმის) წერტილი.

გსურთ, შეუერთდეთ დისკუსიას?

პოსტები ჯერ არ არის.
გესმით ინგლისური? დააწკაპუნეთ აქ და გაეცანით განხილვას ხანის აკადემიის ინგლისურენოვან გვერდზე.