Hans Cappon
Hans Cappon

Een terugblik op het project met Hans Cappon, leider van de werkgroep zuivering. 

Hans Cappon is lector Water Technology aan HZ University of Applied Sciences. Zijn taak is om de ontwikkeling van het praktijkgericht onderzoek in de watertechnologie te bevorderen. “Watertechnologie loopt een klein beetje achter ten opzichte van wat er bijvoorbeeld in de chemische industrie al gebeurt”, zegt hij. “Ik heb de indruk dat de tijd nu pas rijp is voor dit soort digital twin-projecten, maar er zijn nog maar weinig waterschappen bezig met dit soort technieken. Er wordt veel gemeten, maar tot nu toe wordt er relatief weinig mee gedaan.”

Waarom loopt de waterwereld achter?

“Watertechnologie is als vakgebied heel hands-on: we moeten water schoonmaken. We kijken op  metertjes of naar de grafiekjes en zien dat het proces goed loopt en als het niet goed loopt, komt er een aanpassing en dan kijken we of het wel goed is. Er zit over het algemeen weinig slimme sturing in van het systeem zelf. Het is ook een vrij conservatieve markt en vakgebied. Er is veel ontwikkeling, maar vooral aan de technologische kant en niet echt in de combinatie van techniek en computers. Dat is aan het veranderen, maar andere industrieën zijn verder.”

Wat is de rol van jou en jouw organisatie binnen het project Digital twin voor het waterbeheer?

“Wij hebben gekeken naar een digital twin van de zuivering zelf. Er waren drie collega’s bij betrokken. Voor ons als onderzoeksgroep was het ons eerste uitstapje naar daadwerkelijke machine learning. Het lectoraat Data Science bij de HZ is daar al langer mee bezig. Daarom hebben we een onderzoeker van hen aan boord gehaald om ons te ondersteunen.”

Wat was aan het begin van het project jouw definitie van een digital twin? En is deze veranderd?

“Ik denk dat we een redelijk goed beeld hadden van wat de bedoeling was. Een digital twin zorgt er eigenlijk voor dat je twee dingen kunt doen. Het eerste is het proces dusdanig een richting op sturen dat je van tevoren al weet wat er gaat uitkomen, want dat heeft de digitale tweeling al voor je berekend. Het tweede is dat je met een digital twin scenario’s kan doorrekenen en op basis daarvan beslissingen kunt nemen. Hoe kun je als het veel gaat regenen het systeem inrichten dat er zo min mogelijk milieuschade is? Het beste is het als de digital twin parallel loopt aan het echte systeem en daar ook op durft in te grijpen of mag ingrijpen als het nodig is.”

Bij zuivering is dat al geautomatiseerd in een RWZI?

“Ze weten bij het waterschap niet precies hoe dat geregeld wordt. Bij waterschap Vallei en Veluwe is de zuivering in Ede een black box. Er zitten heel veel afhankelijkheden in het systeem die in de loop der tijd zijn toegevoegd. Het is niet duidelijk hoe dat precies werkt en ook de achtergrond is onduidelijk voor het waterschap. Ik zei dat als het systeem volautomatisch is geregeld het enige wat een digital twin zou gaan doen, het simuleren van wat er al wordt gedaan is. Dan gaat het model niets nieuws leren. Het simuleert eigenlijk het regelsysteem dat er al is. Dan kunnen wij geen scenario’s doorrekenen. Hij berekent dan namelijk gewoon wat het ding altijd al doet.”

Is jouw idee in de loop van het project veranderd?

“De definitie niet en de doelstelling ook niet. Je bent wel erg afhankelijk van de hoeveelheid data die je hebt. Dat viel eigenlijk tegen en dat was jammer. Ik had gehoopt dat er vooral aan de voorkant, wat de zuivering in komt, veel meer gegevens beschikbaar zouden zijn. Bij Vallei en Veluwe wordt best veel gemonitord in vergelijking met andere waterschappen en toch is het voor een digital twin nog niet voldoende.”

Combinaties van fysische en machine learning-modellen kunnen betere resultaten opleveren dan niet gecombineerde modellen. Zo is een tijdvertraging tussen regenval en het debiet in het aanvoerstelsel fysisch goed te berekenen, terwijl een machine learning-model dit niet kan benaderen. Wil je deze geleerde les toelichten?

“Stel dat een bui over een gebied trekt. Die valt eerst op de ene plek en gaat daarna verder het gebied in. Het water is in bijvoorbeeld Ede meteen bij de zuivering, maar vanuit Barneveld en de kant van Lunteren duurt het veel langer. Dat buitelt over elkaar heen. Een machine learning-model ziet een constante flow binnenkomen en maakt geen onderscheid tussen wat er op de ene plek valt en het water op de andere plek. Het weet niet wat het daarmee moet doen, want het model ziet niet het verschil. Eenmaal op de zuivering kun je niet onderscheiden van welke kant het water komt. Fysisch kan dat wel. Zo’n fysisch model weet wel waar het water vandaan komt. Eigenlijk is je machine learning-model hierin te dom. Het kan de ruimtelijke en tijds component niet goed vangen.”

Hoe kwamen jullie tot deze geleerde les?

“We zijn met de fysische modellen begonnen, omdat we dat in de eerste instantie begrepen. Daarmee kwamen we best een eind. Toen zijn we het met machine learning gaan proberen. In eerste instantie wilden we het zelf begrijpen. We kwamen tot de conclusie dat machine learning verder vooruit kan voorspellen. Toen gingen we naar hybride modellen kijken. Als je de twee combineert wordt het nog veel beter. Dan gebruik je de kennis die je al hebt en de slimheid van het vele proberen, het machine learning-model.”

Waar is machine learning beter in?

“In het voorspellen van wat er gaat gebeuren. Met een machine learning-model kan je zomaar drie uur vooruit kijken. Dat was voor de zuivering al heel wat. Met een afwijking van minder dan vijf procent. Dat is echt heel precies.”

Zou je het in een volgend project anders aanvliegen door je niet eerst te richten op een fysisch model?

“Ik denk dat ik het misschien parallel zou doen. Het fysische model blijf ik gebruiken, omdat ik wil snappen wat ik zie. Ik wil zicht houden op wat je erin stopt en wat je er uithaalt. Op een gegeven moment worden systemen zo ingewikkeld dat je het als mens niet meer overziet en niet meer snapt. Dan kom je met machine learning vooruit. Daar moet je dan wel op vertrouwen.”

Wilde je het machine learning model real-time trainen?

“Het is wel iets wat hoog op de agenda staat, waar iedereen het over heeft en waar heel veel papers over verschijnen. Dat is een vakgebied op zichzelf. Ze proberen stappen te maken, maar vaak is er nog een soort van ingrijpen nodig van de gebruiker om er chocola van te maken. Er gaat nog veel fout in dit soort modellen.”

Systeemkennis van het aanvoerstelsel en zuivering en kennis van machine learning zijn nodig om een begrijpelijke digital twin te ontwerpen. Wil je deze les toelichten?

“In de zin van dat je hoopt het geheel beter te begrijpen. Ik merk dat mensen op de zuivering willen begrijpen wat er gebeurt. Dat lukt niet altijd. Dat zie je aan die regelsystemen, het draait vanzelf. Maar waarom dat is, dat weten ze niet goed. Er zitten veel afhankelijkheden in en machine learning kan helpen die te ontrafelen en meer inzicht te krijgen.”

Deel dit artikel