Programmēšana

Pandas 1.0 nes lielas pārmaiņas

Python datu analīzes bibliotēka Pandas beidzot ir sasniegusi 1.0 laidiena kandidātu. Pandas 1.0 noņem daudz novecojušu funkcionalitāti un prasa Python 3.6 vai labāku versiju.

Pandas tika izveidotas, lai ērti darbotos ar datiem strukturētos formātos, piemēram, tabulās, matricās un laika rindu datos. Pandas aptumšo lielu daļu R datu bāzu funkcionalitātes un labi darbojas ar citām zinātniskās skaitļošanas bibliotēkām Python pasaulē.

Izmantojot Pandas 1.0, Pandas veidotāji ievieš virkni pārsteidzošu izmaiņu, kas jau kādu laiku ir izstrādātas. Šeit ir aprakstīts vissvarīgākais no tiem un to, kā ar tiem rīkoties turpmāk.

Pandām nepieciešama Python 3.6.1 vai jaunāka versija

Lielākās izmaiņas versijā Pandas 1.0 ir atbalsta samazināšanās visām Python versijām, kas vecākas par Python 3.6.1. Pandas atteicās no Python 2 atbalsta un no 2019. gada uzticējās tikai Python 3, tāpēc tas galvenokārt ir esošās politikas uzlabošana.

Projektā ir arī jauna atbalsta politika nākamajām Pandas versijām. Jebkurš atbalsta samazinājums Python versijai tiks ieviests lielākajās jaunajās Pandas versijās (2.0, 3.0 utt.). Nelieli laidieni pazaudēs funkcijas, taču tās netiks noņemtas; galvenie izlaidumi noņems funkcijas.

Pandas jaunā NA vērtība

Iepriekšējās Pandas versijās trūkstošo datu atveidošanai tika izmantoti dažādi veidi, atkarībā no konteinera veida - viens datuma tipiem, otrs objektiem utt. Visi šie dati tiek apvienoti vienā trūkstošo datu tipā, ko sauc par NA. Pašlaik NA atbalsts ir ierobežots ar dažiem objektu tipiem, un tas tiek uzskatīts par eksperimentālu, tāpēc to vēl nevajadzētu izmantot ražošanā.

API nesaderība

Pandas 1.0 izmaiņu skaita dēļ daži no Pandas API tagad nav savietojami. Tas ietver izmaiņas daudzu izplatītu elementu uzvedībā:

  • The DataFrame tips
  • pandas.array
  • masīvi.IntegerArray

Daudzas no šīm nesaderībām izraisīs brīdinājumus, taču vislabāk ir pārbaudīt esošos Pandas skriptus kopā ar saviem Pandas 1.0 kolēģiem, lai redzētu, kā tie darbojas.

Pandas 1.0 novecojušās funkcijas

Pandas dokumentācijā ir uzskaitītas visas funkcijas, kuras Pandas 1.0 versijā ir jāpārtrauc, bet nav jānoņem. Daži no tiem ir vienkārši pārdēvēti vai reorganizēti, piemēram, testēšanas modulis, bet citi maina noteiktu funkciju parametru izmantošanu. Pāris gadījumos, piemēram, ar Series.item () un Index.item (), funkcijas vairs netiek izmantotas, un tās joprojām būs pieejamas.

Ja izmantojat Pandas versiju, kas vecāka par 0,25, Pandas veidotāji iesaka migrēt uz Pandas 0,25vispirms, pārliecinoties, ka visi no Panda atkarīgie kodi darbojas kā paredzēts,pēc tam migrēšana uz Pandas 1.0. Tas ir paredzēts, lai nodrošinātu, ka visi kodi, kas izmanto novecojušu funkcionalitāti, tiks atzīmēti.

Funkcijas, kas noņemtas versijā Pandas 1.0

Dažas galvenās Pandas funkcijas ir pilnībā noņemtas no Pandas 1.0:

  • SparseSeries un SparseDataFrame. Izmantot Sērija vai DataFrame Ar mazvērtības tā vietā.
  • Matplotlib vienību reģistrācija. Tas tiek darīts, lai, importējot Pandas, netiktu ietekmēts Matplotlib.
  • Daudzas citas funkcijas, kas iepriekš bija novecojušas.

Atkal, tas ir vēl viens iemesls, lai pārbaudītu Pandas 1.0 izlaišanas kandidātu blakus esošajai Pandas instalācijai un pārliecinātos, ka skripti darbojas atbilstoši iecerētajam.

Pandas 1.0 instalēšana

Pandas 1.0 var instalēt tieši Python, izmantojot Pip pakotņu pārvaldnieku, ierakstot pip instalēt pandas. Pandas 1.0 ir pieejams arī kā daļa no Anaconda Python izplatīšanas zinātniskai skaitļošanai.

Visos gadījumos vislabāk ir instalēt Pandas virtuālajā vidē, it īpaši, ja vēlaties kopā ar iepriekšējās versijas kolēģiem palaist Pandas 1.0 skriptu testus.

$config[zx-auto] not found$config[zx-overlay] not found