More on Lists

More on Lists#

Data#

string
integer / float
list

2D arrays zijn lijsten van lijsten, LoL’s

Lists#

Lists zijn containers, ze bevatten verwijzingen naar data

L = [5, 42, "hi"]

List references

Indentiteit#

help(id)

Help on built-in function id in module builtins:

id(obj, /)
    Return the identity of an object.
    
    This is guaranteed to be unique among simultaneously existing objects.
    (CPython uses the object's memory address.)

Het geheugenadres van L

id(L)

139716373086976

De geheugenadressen van de elementen van L

id(L[0])  # 5

139716589758568

id(L[1])  # 42

139716589759752

id(L[2])  # "hi"

139716574851760

Waarde en identiteit#

a = "Astronaut wordt snel oud tijdens een reis naar Mars"
b = "Astronaut wordt snel oud tijdens een reis naar Mars"

a == b

True

a is b

False

id(a)

139716374619712

id(b)

139716374620832

Verwijzingen#

by reference

Lists bevatten verwijzingen naar geheugenadressen, niet de waarden zelf!

by value

Getallen en strings verwijzen naar de waarde

Mutabiliteit#

mutable (veranderlijk)

Lists kunnen worden aangepast

immutable (onveranderlijk)

Getallen en strings kunnen niet worden aangepast

Mutable#

Lists

L = [11, 21]
id(L)

139716373088384

L[0] = 42
id(L)

139716373088384

[42, 21]

Immutable#

Strings en getallen

s = "hallo "
id(s)

139716372918768

s += "wereld"
id(s)

139716372946352

x = 10
id(x)

139716589758728

x += 1
id(x)

139716589758760

Functies?#

by copy

Functies ontvangen parameters als kopie

def fav(x):
    print("fav VOOR: x is", id(x), "en heeft de waarde x", x)
    x = "Pizza quattro formaggi"
    print("fav NA: x is", id(x), "en heeft de waarde x", x)
    
def main():
    y = "Pizza salami ananas"  # bah
    print("main VOOR: y is", id(y), "en heeft de waarde", y)
    fav(y)
    print("main NA: y is", id(y), "en heeft de waarde", y)

main()

main VOOR: y is 139716372861200 en heeft de waarde Pizza salami ananas
fav VOOR: x is 139716372861200 en heeft de waarde x Pizza salami ananas
fav NA: x is 139716372867520 en heeft de waarde x Pizza quattro formaggi
main NA: y is 139716372861200 en heeft de waarde Pizza salami ananas

Shallow versus deep copy#

De ene kopie is de andere niet!

Shallow copy#

Assignment statements in Python do not copy objects, they create bindings between a target and an object.

https://docs.python.org/3/library/copy.html

Wat create bindings hier betekent laten we in het midden, duidelijk is dat geen kopie wordt gecreëerd maar iets van een verwijzing die later eenvoudig te verbreken valt.

x = "regen"
y = x

x is y

True

y = "zonneschijn"

x is y

False

print("Na", x, "komt", y)

Na regen komt zonneschijn

Lists en shallow copy#

L = [5, 42, "hi"]

M = L

M[0] = 60

M[0]

L[0]

Lists zijn mutable en de shadow copy M verwijst nog steeds naar L en een aanpassing van M zal niet leiden tot een nieuwe list (zoals je wel zag gebeuren bij strings en integers).

Deep copy#

Deep copy is alleen relevant voor containertypes als lists!

A deep copy constructs a new compound object and then, recursively, inserts copies into it of the objects found in the original.

https://docs.python.org/3/library/copy.html

Een deep copy creëert een nieuwe container, eventuele wijzigingen zijn vervolgens alleen van toepassing op de kopie, niet het origineel.

from copy import deepcopy

L = [5, 42, "hi"]

M = deepcopy(L)

M is L

False

M[0] = 60

Wat is de waarde van L[0]?

L[0]

from copy import deepcopy

L = [5, 42, "hi"]

M = deepcopy(L)

M is L

False

M[0] = 60

Wat is de waarde van L[0]?

L[0]

Slicing is ook diep!#

L = [5, 42, "hi"]

M = L[:]

M[0] = 60

L[0]

Quiz#

Vraag 1#

def conform1(fav):
    fav = 42
    return fav

def main1():
    fav = 7
    conform1(fav)
    print(fav)

Wat wordt geprint voor fav in de functie main1?

Antwoord#

main1()

Vraag 2#

def conform2(L):
    L = [42, 42]
    return L

def main2():
    L = [7, 11]
    conform2(L)
    print(L)

Wat wordt geprint voor L in de functie main2?

Antwoord#

main2()

[7, 11]

Vraag 3#

def conform3(L):
    L[0] = 42
    L[1] = 42
    
def main3():
    L = [7, 11]
    conform3(L)
    print(L)

Wat wordt geprint voor L in de functie main3?

Antwoord#

main3()

[42, 42]

Dictionaries#

Dictionaries zijn willekeurige containers

d = {47: 2, 42: 1}

Elementen (of waarden) worden opgehaald met een sleutel op een willekeurige positie

d[47] == 2
d[42] == 1

Goed nieuws, sleutels kunnen ook andere typen dan int zijn!

Van Dale

Een bekende structuur#

woord ⟶ verklaring
naam ⟶ telefoonnummer
afkorting ⟶ betekenis
dier ⟶ jaren Chinese dierenriem

Chinese dierenriem

Dictionaries zijn `in`#

z = {
    "rabbit": [1999, 1987, 1975],
    "ox": [1997, 1985, 1973],
    "dragon": [2000, 1998]
}

De sleutels zijn hier strings en de bijbehorende waarden zijn lists. Dit voorbeeld gaat over de jaren per dier in de Chinese dierenriem, zie het Wikipedia artikel voor alle dieren en jaren!

Is "dragon" een sleutel in z?

"dragon" in z

True

Is 1969 een waarde in z["dragon"]?

1969 in z["dragon"]

False

Woorden tellen#

LoW = ["spam", "spam", "taart", "spam"]

d = {}

for w in LoW:
    if w not in d:
        d[w] = 1
    else:
        d[w] += 1

{'spam': 3, 'taart': 1}

Model genereren#

Gegegeven de volgende text:

text = "Ik wil taarten en 42 en spam. Ik krijg toch spam en taarten voor de vakantie? Ik wil 42 taarten!"

LoW = text.split()
d = {}

for w in LoW:
    if w not in d:
        d[w] = 1
    else:
        d[w] += 1
        
print(f"There are {len(d)} DISTINCT words")  # expressions in f-strings!

d

There are 13 DISTINCT words

{'Ik': 3,
 'wil': 2,
 'taarten': 2,
 'en': 3,
 '42': 2,
 'spam.': 1,
 'krijg': 1,
 'toch': 1,
 'spam': 1,
 'voor': 1,
 'de': 1,
 'vakantie?': 1,
 'taarten!': 1}

Met een paar aanpassingen van het programma dat worden telt, is het mogelijk om een eenvoudige taalgenerator te maken.

In plaats van het tellen van woorden zal worden gekeken welk woord na een voorgaand woord wordt gebruikt.

%run assets/markov.py

d = create_dictionary(text)

{'$': ['Ik', 'Ik', 'Ik'],
 'Ik': ['wil', 'krijg', 'wil'],
 'wil': ['taarten', '42'],
 'taarten': ['en', 'voor'],
 'en': ['42', 'spam.', 'taarten'],
 '42': ['en', 'taarten!'],
 'krijg': ['toch'],
 'toch': ['spam'],
 'spam': ['en'],
 'voor': ['de'],
 'de': ['vakantie?']}

Het stappenplan voor het maken van een taalmodel is als volgt:

begin met het vorige woord pw als “$”
voor elk volgend woord in de lijst van woorden voeg het toe aan …
maak pw gelijk aan nw
- behalve als nw[-1] punctuatie is, maak pw dan gelijk aan …

Tekst genereren#

Een $ staat voor het begin van een zin. Dit model heeft voor elk woord een lijst van woorden waar uit gekozen kan worden. Als we dit random doen, wordt er een random tekst genereerd.

generate_text(d, 42)

'Ik krijg toch spam en taarten en 42 en taarten voor de vakantie? Ik wil taarten en spam. Ik wil 42 taarten! Ik wil 42 taarten! Ik wil 42 en 42 taarten! Ik krijg toch spam en 42 taarten! Ik krijg toch '

Als we een veel grotere tekst gebruiken om onze database mee te vullen, kunnen we betere teksten generen.

Het stappenplan voor het genereren van tekst is als volgt:

begin met pw als de “$” string
kies random een nw dat volgt op pw en voeg het toe aan …
maak pw gelijk aan nw
- behalve als nw[-1] punctuatie is, maak dan pw gelijk aan …

More on Lists

Inhoud

More on Lists#

Data#

Lists#

Indentiteit#

Waarde en identiteit#

Verwijzingen#

Mutabiliteit#

Mutable#

Immutable#

Functies?#

Shallow versus deep copy#

Shallow copy#

Lists en shallow copy#

Deep copy#

Slicing is ook diep!#

Quiz#

Vraag 1#

Antwoord#

Vraag 2#

Antwoord#

Vraag 3#

Antwoord#

Dictionaries#

Een bekende structuur#

Dictionaries zijn in#

Woorden tellen#

Model genereren#

Tekst genereren#

Dictionaries zijn `in`#