Hoe werkt binnen Bluetick het zoeken op overweging?

Het vinden van uitspraken met vergelijkbare overwegingen is belangrijk om een collectie van jurisprudentie op te bouwen. Om je standpunt sterker te maken helpt het om uitspraken te vinden die beter bij de feiten van je casus aansluiten, je standpunt ondersteunen, of juist onderuit halen. Bij Bluetick maken we dit veel makkelijker door te zoeken op de betekenis van een overweging, in plaats van op exacte verwoordingen of zoektermen. Hoe dit in zijn werk gaat lees je in deze blog.
Hoe werkt het zoeken op overweging?
Om een vergelijkbare overweging te vinden selecteer je binnen Bluetick een passage, waarna je eenvoudig op deze tekst doorzoekt. Het systeem toont vervolgens resultaten die een overweging bevatten met eenzelfde betekenis, maar waarschijnlijk een andere verwoording. Dit kan omdat wij elke overweging (en de zoekopdracht) transformeren naar een getallenreeks. Op deze manier kunnen we rekenen met tekst. Onderstaand een voorbeeld:
Zoekopdracht (ECLI:NL:GHSHE:2019:2335):
In artikel 7:204 lid 2 BW is een gebrek omschreven als een staat of eigenschap van de zaak of een andere niet aan de huurder toe te rekenen omstandigheid, waardoor de zaak aan de huurder niet het genot kan verschaffen dat een huurder bij het aangaan van de overeenkomst mag verwachten van een goed onderhouden zaak van de soort als waarop de overeenkomst betrekking heeft. Wil [appellant] aanspraak kunnen maken op huurprijsvermindering zoals door hem in hoger beroep gevorderd, zal dienen vast te staan dat sprake is van een vermindering van het huurgenot als gevolg van een gebrek als bedoeld in artikel 7:204 lid 2 BW. In hoger beroep gaat het hierbij om het door [appellant] gestelde gebrek aan de vloerverwarming waardoor de woonkamer onvoldoende (gelijkmatig) kan worden verwarmd.
6.8. Of een dergelijk gebrek zich al dan niet voordoet, dient op een objectieve wijze te worden bepaald, aan de hand van feitelijke gegevens en niet aan de hand van de subjectieve beleving van een huurder
Zoekresultaat (ECLI:NL:GHARL:2019:1995):
Uitgangspunt bij de beoordeling van de gestelde gebreken is het bepaalde in artikel 7:204 lid 2 BW, waarin ‘een gebrek’ wordt gedefinieerd als een staat of eigenschap van de zaak of een andere niet aan de huurder toe te rekenen omstandigheid, waardoor de zaak aan de huurder niet het genot kan verschaffen dat een huurder bij het aangaan van de overeenkomst mag verwachten van een goed onderhouden zaak van de soort als waarop de overeenkomst betrekking heeft. De vraag of er sprake is geweest van beperking van het huurgenot die tot huurprijsvermindering aanleiding kan geven, moet in beginsel beoordeeld worden naar objectieve maatstaven. Bij de beoordeling moet met name worden gelet op de aard en de omvang van de voor rekening van de verhuurder komende gebreken en op de voortvarendheid waarmee de gebreken zijn verholpen. Stelplicht en bewijslast met betrekking tot de beweerdelijke beperking van het huurgenot berusten bij de huurder.
Hoe leert een computer vergelijkbaarheid herkennen?
De huidige strategie van AI onderzoekers om computers taal te laten begrijpen, is om eerst een groot model te trainen waar bepaalde woorden gemaskeerd worden. Het model moet vervolgens ‘voorspellen’ welke woorden er op de posities van de maskeringen stonden.
In dit stuk tekst zal [MASK] gedeelte van de woorden verborgen zijn. Het doel is dat het model leert welke [MASK] er stonden en dus menselijke taal kan ‘begrijpen’. Het voordeel [MASK] deze manier van trainen is dat er geen [MASK] gelabeld hoeft te worden. Dit zorgt ervoor dat er goedkoop op veel data [MASK] kan worden. Voorbeelden van [MASK] zijn GPT-3 en BERT.
Bovenstaande modellen hebben ‘out-of-the-box’ een goed begrip van de menselijke taal in zijn algemeenheid en zouden dus al gebruikt kunnen worden om vergelijkbare overwegingen te vinden. Echter is de kwaliteit niet dermate goed voor deze taak en subdomein (juridische taal) dat het praktisch bruikbaar is.
Om dit wel te bereiken moeten er nog een paar extra stappen gezet worden. Het liefst ‘voedt’ je het model met data die aangeeft in welke mate juristen vinden dat twee overwegingen vergelijkbaar zijn. Deze data is echter momenteel niet beschikbaar, dus gebruiken we andere signalen die aangeven in welke mate twee overwegingen vergelijkbaar zijn. Voorbeelden van signalen zijn overwegingen die: vergelijkbare juridische termen bevatten, uit hetzelfde rechtsgebied komen, hetzelfde wetsartikel citeren. Andere signalen zijn twee uitspraken die binnen één stuk literatuur worden geciteerd, een gebruiker van ons zoeksysteem die aangeeft dat een resultaat relevant is, of mensen data laten labelen.
In de praktijk blijkt dat bovenstaande extra stappen daadwerkelijk zorgt voor een significante kwaliteitsverbetering, wat natuurlijk goed nieuws is. Er zijn echter nog wel een paar limitaties.
Limitaties
Twee van de limitaties zijn als volgt: ten eerste staat een overweging natuurlijk nooit op zichzelf. Het gaat bijvoorbeeld ook om de feiten en de overige overwegingen van de desbetreffende uitspraak. Om dit mee te nemen moet ook de rest van de uitspraak gebruikt worden om de te bepalen wat relevante overwegingen zijn. Ten tweede is relevantie voor de ene casus, dat niet per se voor een andere casus. Iedere situatie is namelijk uniek. Hoe we met deze twee limitaties omgaan leg ik in een volgende blog uit.
Geïnteresseerd om meer over dit of een soortgelijk onderwerp te leren? Neem dan contact met mij op via thijs.kranenburg@bluetick.nl. Verder lezen kan ook in deel 1, deel 2, deel 3 en deel 4 en deel 5 van deze blogserie.