Processing math: 100%

lauantai 21. elokuuta 2021

Newtonia yleistämään

Matematiikka tutkii struktuureja. Jos kahdesta asiasta löytyy samanlainen struktuuri, niin toista koskevat tuloksetkin ehkä voidaan siirtää toiseen, mahdollisesti yleistää suppeammasta asiasta laajempaan. Struktuurin tunnistaminen voi kuitenkin edellyttää näkökulman vaihtoa. Katsellaanpa Newtonin iteraatiota:

Yhtälöä f(x)=0 voidaan yrittää ratkaista numeerisesti arvaamalla juurelle x jokin likiarvo x0 ja asettamalla funktion f kuvaajalle pisteeseen (x0,f(x0)) tangentti. Jos x0 on riittävän lähellä juurta x, tangentin ja x-akselin leikkauspisteestä saadaan tarkempi likiarvo x1. Tangentin yhtälö on yf(x0)=f(x0)(xx0).  Asettamalla tässä y=0 ja ratkaisemalla x saadaan leikkauspisteeksi x-akselin kanssa x1=x0f(x0)f(x0).

Newtonin menetelmän johto tangentin avulla

Toistamalla menettely arvosta x1 lähtien saadaan uusi likiarvo x2. Kun näin jatketaan, saadaan jono x0, x1, x2, , joka varsin yleisillä edellytyksillä suppenee kohden juurta x. Jono muodostetaan siten iteraatiokaavalla xn+1=xnf(xn)f(xn),n=0, 1, 2, . Menettelyä kutsutaan Newtonin iteraatioksi ja se lienee ensimmäinen numeerinen menetelmä, jonka matematiikan opiskelija oppii.

Ei ole kuitenkaan aivan helppoa nähdä, miten menettely pitäisi yleistää, jos kyseessä onkin yhtälöryhmä. Kahden yhtälön tapauksessa tangenttitasojen kuvittelu voi jotenkin onnistua, mutta isommat yhtälöryhmät ovat jo aika ylivoimaisia mielikuvitukselle.  Näkökulman vaihto kuitenkin auttaa.

 Derivaatta on erotusosamäärän raja-arvo, jolloin lauseke ε(x,x0)=f(x)f(x0)xx0f(x0) lähestyy nollaa, kun x lähestyy arvoa x0. Tämä voidaan saattaa muotoon f(x)=f(x0)+f(x0)(xx0)+ε(x,x0)(xx0). Termiä f(x0)(xx0) kutsutaan differentiaaliksi, termi ε(x,x0)(xx0) saa usein nimekseen korjaustermi. Differentiaali on muuttujan x suhteen ensimmäistä astetta, se on ns. lineaarinen termi, joka rajaprosessissa xx0 lähestyy nollaa tekijän xx0 takia. Korjaustermi lähestyy vahvemmin nollaa, sillä sen kumpikin tekijä lähestyy rajaprosessissa nollaa.

Lauseketta f(x0)+f(x0)(xx0) voidaan pitää sitä parempana funktion f(x) approksimaationa mitä lähempänä kohtaa x0 ollaan. Voidaankin ajatella, että etsitään tämän nollakohta funktion f(x) nollakohdan sijasta. Aivan sama tämä ei tietenkään ole, mutta ehkä kuitenkin lähempänä. Tällä tavoin päädytään Newtonin menetelmän iteraatiokaavaan. Suppenemisesta ei tämäkään näkökulma vielä kerro, vaan se tarvitsee oman analyysinsa.

Newtonin menetelmän yleistämiseen näkökulma kelpaa. Oleellista on löytää lineaarinen differentiaalitermi ja käyttää sitä funktion approksimoimisessa. Kahden yhtälön tapauksessa ratkaistava yhtälöryhmä on {f(x,y)=0,g(x,y)=0. Kahden muuttujan differentiaalilaskennan mukaan differentiaalitermi on summa funktion osittaisderivaatoista kerrottuna vastaavalla muuttujaerotuksella, funktiolle f siis fx(x0,y0)(xx0)+fy(x0,y0)(yy0), missä fx ja fy ovat osittaisderivaatat (ts. funktion derivaatta x:n suhteen pitäen y:tä vakiona ja derivaatta y:n suhteen pitäen x:ää vakiona). Vastaavasti funktiolle g.

Yhtälöryhmää voidaan nyt approksimoida vastaavasti kuin yhden muuttujan tapauksessa: {f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)=0,g(x0,y0)+gx(x0,y0)(xx0)+gy(x0,y0)(yy0)=0. Tämä on lineaarinen yhtälöryhmä tuntemattomina x ja y ja ratkaisu antaa parannetut approksimaatiot x1 ja y1. Toistamalla askelta saadaan generoiduksi jono (x0,y0), (x1,y1), (x2,y2), , joka eräin edellytyksin lähestyy yhtälöryhmän ratkaisua (x,y).

Matriisialgebraan perehtynyt henkilö kirjoittaa lineaarisen yhtälöryhmän muotoon F(X0)+DF(X0)(XX0)=O, missä F(X0)=(f(x0,y0)g(x0,y0)),DF(X0)=(fx(x0,y0)fy(x0,y0)gx(x0,y0)gy(x0,y0)),X0=(x0y0),X=(xy),O=(00). Ratkaisemalla X saadaan X=X0D1F(X0)F(X0). Tässä DF on osittaisderivaattojen muodostama matriisi, joka on Jacobi'n matriisiksi kutsuttu yhden muuttujan funktion derivaatan yleistys. D1F on sen käänteismatriisi. Täten on päädytty iteraatiokaavaan Xn+1=XnD1F(Xn)F(Xn), jonka analogia yhden muuttujan tapaukseen on ilmeinen. Yleistys useamman yhtälön ryhmiin on suoraviivainen: sama iteraatiokaava pätee, matriisien koko vain on suurempi.

Ei kommentteja: