Om användning av automatisk databehandlingsteknik inom juridiken

 

II: Automatiserad informationssökning

 

Av jur. kand. Peter Seipel

 

1. Inledning
Den praktiskt mest betydelsefulla användningen av automatiska datorer inom juridiken torde f. n. avse automatiserad informationssökning. Utvecklingen går tämligen långt tillbaka i tiden och juridiska, automatiserade informationssökningssystem togs i USA i bruk redan i slutet av 50-talet.1 De mest avancerade systemen återfinns alltjämt bland de amerikanska men en rad intressanta projekt är under utveckling på andra håll sedan jurister i olika länder blivit varse de värdefulla tjänster ADB-tekniken kan uträtta i den rättsliga kommunikationsprocessen.
    Den följande framställningen syftar inte till att ge någon uttömmande beskrivning av alla aktuella aktiviteter på området.2 Avsikten är att behandla några viktiga, allmänna problem, vilka sammanhänger med datoranvändning för lagring och återvinning av olika slags juridiska texter. Detta utesluter inte att åtskilliga praktiska exempel tas med som illustrationer och avslutningsvis kommer det svenska arbetet inom ramen för RI (Rättsväsendets Informationssystem) och vissa andra projekt att ges en närmare presentation.

 

Denna uppsats anknyter direkt till artikeln: Om användning av automatisk databehandlingsteknik inom juridiken. I: Tillämpning och analys av rättsregler, SvJT 1970 s. 257), till vilken läsaren hänvisas för en närmare genomgång av terminologi, metodproblem m. m.

 

1 Jfr V. Biunno, History of Electronic Methods for Legal Research, Modern Uses of Logic in Law (MULL) 1960/sept., s. 99 ff. Även J. Horty, The Key Words in Combination Approach, MULL 1962/mars, s. 54 ff.

2 USA: En god överblick över den amerikanska situationen och dess utveckling under det senaste decenniet ger följande publikationer. M. Duggan, Legal Research Projects, MULL 1965/juni, s. 83 ff med supplement i MULL 1966/juni, s. 97 ff. I. Kayton, Retrieving Case Law by Computer. Facts, Fiction and Future, George Washington Law Review 1966/1, s. 1 ff. J. Lyons, Recomp, Law and Computer Technology 1968/1, s. 22 ff. R. von Briesen, Status of Legal Use of Computers, Law and Computer Technology 1968/4, s. 9ff. Vid det amerikanska Patent Office bedrivs sedan flera år tillbaka olika verksamheter såsom försök med automatiserad indexering och med automatiserad utsökning av patentskrifter. Motsvarande arbete bedrivs även på det internationella området, där ett särskilt tillskapat samarbetsorgan (ICIREPAT)

Automatisk databehandlingsteknik inom juridiken 723administrerat av BIRPI skall uppmärksammas. Se A. Riddles, Computer Based Concept Searching of United States Patent Claims, MULL 1965/dec., s. 175 ff. J. Stitelman, International Cooperation in Automated Patent Searching, Law and Computer Technology 1968/2, s. 15 ff och PCT-planen och patentverkets service; preliminär promemoria av Patentpolicykommittén (H 1970: 1), s. 47—48.
    Kanada: Flera avancerade kanadensiska aktiviteter på den juridiska informationssökningens område har rapporterats. Se ex:vis K. Latta, Information Retrieval. An Automated System for Case Law, Canadian Bar Journal 1967/10, s. 110 ff. S. Skelly, Computerization of Canadian Statute Law, Law and Computer Technology 1968/2, s. 10 ff. J. Boucher, Le Projet Datum, Information Science in Canada 1970/1, s. 17.
    Europa: Det belgiska CREDOC-systemet, vars uppbyggnad inleddes 1967 och som f. n. omfattar över 40 000 dokumentreferenser (lagtext, rättsfall, doktrin), beskrivs i sin nuvarande utformning av E. Houtart, i Le droit et l'électronique, Law and Computer Technology 1969/6, s. 15 ff. Se även Le CREDOC; description du systéme et réalisations actuelles, CREDOC, a. s. b. l., maj 1969. I Frankrike pågår flera intressanta verksamheter administrerade av bl.a. justitieministeriet, advokat- och notariatväsendet och flera universitet. Man finner exempel på projekt med såväl praktisk som rättsvetenskaplig/dokumentationsteknisk inriktning. Se uppsatssamlingen L'Informatique et le droit, Revue Internationale de Droit Comparé, 1968/4 (okt.—dec.), s. 617 ff. Vidare A. David, Plan de recherche concernant la documentation juridique automatique, Law and Computer Technology 1968/1, s. 11 och 1968/6, s. 13. C. Lussan (m. fl.), Les activités du centre d'informatique du barreau de Paris, Law and Computer Technology 1968/6, s. 23 ff. J. Chamoux, L'Automatisation administrative chez les notaires, Law and Computer Technology 1969/12, s. 4 ff. J. Breton, DOCILIS ou la documentation souple: comment les textes de droit français sont enregistrés en ordinateur, Law and Computer Technology 1969/12, s. 26 ff.
    Från Västtyskland har endast mindre omfattande försöksverksamhet rapporterats. Se S. Simitis, Zum Stand der juristischen Datenverarbeitung in der Bundesrepublik Deutschland, Law and Computer Technology 1968/6, s. 4. Visst samarbete bedrivs mellan universitetet i Freiburg och det belgiska CREDOC-projektet (jfr ovan). Om engelska aktiviteter se C. Tapper, British Experience in Legal Information Retrieval, MULL 1964/dec., s. 127 ff och densamme, Legal Information and Computers: Great Britain, Law and Computer Technology 1968/1, s. 18. Vidare D. Harris och A. Kent, The Computer as an Aid to Lawyers, The Computer Journal 1967/maj, s. 22 ff.
    Stats- och Rättsvetenskapliga Institutet vid den tjeckiska vetenskapsakademin är sedan flera år tillbaka engagerat i juridisk informationssökning och i Sovjetunionen har Rättsvetenskapliga forskningsrådet ett särskilt organ som studerar datoranvändning inom den juridiska dokumentationstjänsten och utvecklar de tekniska hjälpmedlen. Se V. Ivanov och A. Sjljachov, Om den automatiserade informationstjänstens organisation på det juridiska området, Sovjetskoje Gosudarstvo i Pravo 1968/5, s. 72 ff.

    I Danmark tillsattes 1967 ett 'informationssogningsudvalg', vilket lett arbetet på en förstudie avseende i första hand utsökning av datorlagrad lagtext. Se U. Kornerup, EDB-Informationssogning, Juristen 1970/11, s. 229 ff. I Norge har hittills saknats ett samordnande organ motsvarande det danska 'informationssøgningsudvalget' och det svenska samarbetsorganet för ADB inom rättsväsendet. Begränsade projekt har rapporterats (ex:vis vid Patentstyret) men den norska utvecklingen befinner sig ännu i ett inledande skede. Se Referat fra Institutt for privatretts "EDB-møte" 16. mars 1970 (Stencil).
    Bland internationella organisationer, vilkas verksamhet äger betydelse för den juridiska, automatiserade informationssökningens utveckling kan nämnas Europarådets 'Committee of Experts on the Harmonisation of the Means of Programming Legal Data into Computers', Interdoc och 'the Legal Service of the Commission of the European Communities'. Den senare organisationen har bl. a. med datorns hjälp tagit fram ett fyrspråkigt, juridiskt index. Jfr M. Gaudet, L'Informatique juridique dans sa dimension communautaire, Law and Computer Technology 1968/6, s. 9 ff.

724 Peter Seipel2. Allmänna problem
En viktig anledning till datamaskinteknikens aktualitet inom det juridiska fältet3 sammanhänger med svårigheten att hantera en snabbt växande informationsmängd nedlagd i författningar, rättsfallsreferat och den juridiska litteraturen. Dessa problem delar juridiken med en rad andra områden4 och de får särskild aktualitet genom att juridiskt material ofta bevarar sitt informationsvärde under lång tid.5 Man bör också uppmärksamma, att den grundläggande ideologi som föreskriver konsekvens och enhetlighet vid uppbyggnaden av en rättsordning alltmer kommer att strida mot den faktiska svåröverskådligheten. I denna situation ger ADB-tekniken möjligheter att säkerställa kvalitén hos juridiska problemlösningar av skilda slag och kan förhoppningsvis också medföra vissa förbättringar.
    Metoderna för automatiserad, juridisk informationssökning är i princip desamma som är i allmänt bruk på andra områden. Detta innebär, att samtidigt som de egna delproblemen studeras stor uppmärksamhet måste ägnas både åt vad som konkret kommer till utförande på andra håll och åt de allmänna erfarenheter av teoretisk natur som efterhand formuleras inom teorin för informationssystem, speciellt dokumentationssystem. Dylika generella erfarenheter är ännu tämligen tunnsådda och svårgripbara.6 Å andra sidan möter en rad för det juridiska fältet speciella problem, vilka ofta är av praktisk natur — t. ex. kartläggning av informationsströmmar inom rättsordningen (vilka författningspublikationer finns, var utnyttjas de, vilken ändringsfrekvens är att räkna med etc.).

 

3 I det amerikanska rättssystemet har svårigheterna som tidigare berörts en betydande omfattning. Se om detta I. Kayton, op.cit (not 2), s. 6 ff. Antalet rapporterade rättsfall är f. n. uppe i omkring 2,5 miljoner. Jag sätter dock frågetecken för Kayton's uppgift att antalet skulle växa med 22 000 rapporterade fall per månad. Siffran skall såvitt jag har kunnat finna vara betydligt lägre. Se ex:vis M. Price, H. Bitner, Effective Legal Research, Boston 1953, s. 94 (där siffran 30 000 per år nämns). Ingen rättsordning torde undgå att få känning av problemen. Se t. ex. J.Goulet, Revalorisation du droit et jurimétrie, Les Cahiers de Droit 1967—68/1 s. 9 ff. V. Ivanov, A. Sjljachov, op.cit. s. 72 och C. Tapper, World Cooperation in the Mechanisation of Legal Information Retrieval, work paper World Peace Through Law, Geneva Conference, juli 1967. I Sverige har sekreteraren i utredningen om författningspublicering (jfr not 46) hovrättsfiskalen T. Huldén gjort en överslagsmässig uppskattning av författningstextersvolym och tillväxttakt, vilken (som man kunde vänta) tyder på att problemen är stora även för den svenska rättsordningens del.

4 Se t. ex. Libraries of the Future, ed. J. Licklider, Cambridge 1965, s. 13 ff.

5 Som en kuriositet kan nämnas ett israeliskt projekt ("the Hebrew Responsa Project"), i vilket juridiskt material som tillkommit under en tidrymd av 17 sekler behandlas. Se A. Schreiber, Computerized Storage and Retrieval of Case Law without Indexing: The Hebrew Responsa Project, Law and Computer Technology 1969/11, s. 14 ff.

6 Jfr N. Lindecrantz, Dokumentation och datamaskiner, Lund 1967, s. 12.

Automatisk databehandlingsteknik inom juridiken 725    Ett enkelt sätt att utnyttja datorn för juridisk informationssökning realiserades i ett tidigt amerikanskt system kallat 'Point of Law'- systemet.7 Tekniken var följande. För varje ifrågavarande rättsområde uppgörs omfattande förteckningar över de förekommande rättsfrågorna. Varje rättsfråga betecknas med en deskriptor (ett nyckelord) och till varje deskriptor anknyts ett kodnummer. Dokument (textenheter, t. ex. ett rättsfall, en uppsats eller en lagparagraf) som skall ingå i databasen klassificeras manuellt genom att åsättas ett eller flera kodnummer. Dokumenten lagras i s. k. fulltextform (d. v. s. ord för ord) på magnetband och identifieras där av de tilldelade kodnumren. Användaren utnyttjar systemet genom att ur en deskriptorkatalog (en tesaurus, jfr nedan) söka fram de kodbeteckningar som närmast svarar mot hans problem. Magnetbandet avsöks och de dokument som åsatts kodnumret i fråga sorteras ut och görs tillgängliga genom en hänvisning eller genom att med varierande grad av fullständighet skrivas ut.
    'Point of Law'-systemet rymmer många uppenbara svagheter. Således kan inga relationer mellan deskriptorer (kodnummer) anges vid sökningen (exempelvis att sökningen endast skall avse sådana rättsfall som behandlar både 'otrohet' och 'skadestånd'). Man uppmärksammar också den grundläggande svårigheten att på ett tillfredsställande sätt beskriva ett rättsområde med en uppsättning begreppsbestämningar i form av deskriptorer: å ena sidan har varje sektor av rättsordningen en komplicerad och dynamisk struktur, å andra sidan är användarnas synpunkter och frågor svåra att förutse. Härtill kommer det ofta framhävda problemet att olika personer (och samma person vid olika tillfällen) klassificerar dokument och sökfrågor på olika sätt7a varigenom risken för informationsförlust blir stor.
    Trots de svårigheter som uppenbarligen möter har automatiserade, juridiska informationssökningssystem baserade på rent manuell indexering haft framgång. Ett exempel är det kommersiella Law Research Service, Inc. (LRS-systemet), New York. LRS-systemet blev

 

7 T. Morgan, The Point of Law Approach, MULL mars 1962, s. 44 ff.

7a För juridikens del har detta konstaterats i flera undersökningar. Se t. ex. C. Tapper, British Experience in Legal Information Retrieval (anförd i not 2), s. 128. Försöken med manuell indexering var så nedslående att man helt övergav en metod som nödvändiggjorde sådan. En intressant undersökningav generellt slag har verkställts av överbibliotekarie Björn Tell. I denna utreds graden av enhetlighet vid åsättande av indextermer då dokumenten representeras av titlar, referat respektive hela texter. Se B. Tell, Document Representation and Indexer Consistency. A. Study of Indexing from Titles, Abstracts and Full Text Using UDC and Keywords, AB Atomenergi 25.3.69 (stencil).

726 Peter Seipeloperativt 1964 och ett avtal med Western Union 1965 har möjliggjort datatransmission: användarna runt om i landet (1964 mer än 5 000) kommunicerar via telex direkt med den centrala datamaskinanläggningen i New York. Systemet är i första hand rättsfallsorienterat. Dokument som tillförs databanken klassificeras genom att åsättas en eller flera deskriptorer, vilka liksom i 'Point of Law'-systemet anger de avhandlade rättsfrågorna. Deskriptorerna hämtas ur särskilda deskriptorförteckningar, s. k. tesauri. En tesaurus är enkelt uttryckt ett begreppslexikon, där ord som betydelsemässigt är relaterade till varandra förtecknas och de inbördes relationerna och ordens användning preciseras. Deskriptorsystemets karaktär (det har en grund hierarkisk struktur) belyses av följande två exempel på deskriptorer: "Conflict-Discussion-Foreign Divorce, Conflict of Laws-Burden of Proof"; "Conflict-Discussion-Foreign Divorce, Conflict of Laws-General Principles".
    Någon fulltextversion av rättsfallsreferaten lagras inte i datamaskinminnet; man begränsar sig till att ge hänvisningar till rättsfallssamlingar där texten återfinns och hålla dessa tillgängliga i mikrofilmad form.
    Användaren utnyttjar systemet genom att i en för rättsområdet och delstaten gällande tesaurus finna de deskriptorer (med anknytande kodnummer) vilka täcker hans fråga. Via en terminalskrivmaskin sänder han de valda kodnumren till datamaskincentralen och får för varje nummer hänvisningar till de tio i tidsordning senaste rättsfall vilka klassificerats med motsvarande deskriptor. Ytterligare rättsfall kan i särskild ordning identifieras. Någon möjlighet att med enkel söklogik kombinera deskriptornumren (jfr ovan) finns inte. Vid behov kan användaren från mikrofilmbanken beställa önskade rättsfall varvid kopior av referaten översänds per post.8
    Det belgiska CREDOC-systemet (jfr ovan not 2) utgör ännu ett exempel på att en teknik som utgår från manuell indexering och lagrar dokument innehållande formella uppgifter (t. ex. domstolens namn, domens datum, parter, etc.) jämte en uppsättning karaktäriserande deskriptorer ännu inte spelat ut sin roll. Tesaurus i CREDOC-systemet omfattar f. n. en baslista (en grovklassificering), vilken rymmer c:a 6 000 termer. Till denna anknyter en förteckning över "nyanser" kopplad till vissa av baslistans termer (c:a 2 500), vilket sammanlagt ger över 20 000 tesaurus-termer.

 

8 Om LRS-systemet se E. Hoppenfeld, Law Research Service, Inc., MULL mars 1966, s. 46 ff. Om de tekniska aspekterna se S. Wernikoff, Information Services Computer Center, Western Union Technical Review juli 1966, s. 129 ff.

Automatisk databehandlingsteknik inom juridiken 727    Kostnaderna och svårigheterna vid manuell indexering har ofta lett till att man på olika sätt sökt undvika detta arbetsmoment. Vanligen har man följt följande schema:
1. Dokumenten lagras i fulltextform i datamaskinens minne.
2. Ett särskilt program extraherar ur texterna ord som ur söksynpunkt inte är relevanta — främst prepositioner, konjunktioner, pronomen, prominalia (ex. sådan, annan) och hjälpverb. Dessa ord kan kallas 'tomma ord'.
3. Återstående ord (sökorden) sorteras i ett särskilt s. k. inverterat register i alfabetisk ordning, varvid för varje ord med numeriska kodbeteckningar anges alla de ställen i textmassan där ordet förekommer — således (för varje förekomst) i vilket dokument, på vilken sida, i vilken mening och var i meningen ordet står.
    Sökning sker genom att användaren anger ord och ordkombinationer som enligt hans mening bör förekomma i dokument med relevans för hans fråga (sökning med nyckelordskombinationer).Frågelogiken byggs upp med användning av i första hand de logiska operatorerna för konjunktion ('både — och'), inklusiv disjunktion ('antingen — eller' eller 'båda') och negation ('men inte'). I frågan kan anges exakt hur orden skall stå i förhållande till varandra: sålunda kan en fråga ange att ordet 'tredje' skall stå omedelbart före 'man', varigenom dokument som innehåller t. ex. 'tredje man' tas med medan dokument som innehåller t. ex. 'tredje juni' hålls utanför. En fråga kan således schematiskt formuleras på följande sätt: "Sök de dokument som innehåller orden 'skadebringande egenskaper' och 'tredje man' eller 'följdskador av fel i godset' och 'tredje man' ".
    Eftersom en fulltextversion av dokumenten finns lagrad i ett av datamaskinens register kan utmatningsprodukten varieras från enkla hänvisningar eller extrakt (t. ex. rättsfallsrubriker) till utskrift av hela texter.
    Ett juridiskt, automatiserat informationssökningssystem av nu skisserad typ utvecklades i slutet av femtiotalet vid universitetet i Pittsburgh (under ledning av professor J. Horty) i samband med ett kartläggningsarbete av sjukvårdslagstiftningen i USA.9 Metoden har i all sin enkelhet visat sig effektiv och utnyttjas f. n. i en rad juridiska informationssökningssystem i USA och andra länder.10 Jämte

 

9 Se J. Horty, op.cit. (not 1).

10 Om USA se von Briesen, op.cit. Vidare C. Tapper, Legal Information and Computers (anförd i not 2), D. Harris, A. Kent, op.cit., S. Skelly, op.cit. och V. Ivanov, A Sjljachov, op.cit. Metoden är vanlig också utanför det juridiska fältet.

728 Peter Seipelprofessor Horty's nu kommersiella system (Automated Law Searching, Pittsburgh) torde det mest omfattande av dessa vara LITE (Legal Information Through Electronic)-systemet, vilket betjänar de federala statsmyndigheterna i USA och närmast administreras av US Air Force.11 Databasen i LITE omfattar juridiska texter av olika slag, främst lagtext, administrativa beslut och rättsfallsreferat. År 1964 fanns i systemet tillgänglig en textmassa på 17 miljoner ord och våren 1967 var man uppe i omkring 60 miljoner. Databasen utvidgas kontinuerligt och torde f. n. omfatta minst 100 miljoner ord.12
    De hittills behandlade informationssökningssystemen har alla karaktär av dokumentsökningssystem d. v. s. system där användaren som svar erhåller dokumenttext (fullständig version eller endast utdrag) eller dokumenthänvisningar och ur dokumenten har att söka fram önskad information. En annan typ av informationssökningssystem kan kallas faktasökande system (question answering systems).
    I dessa erhåller användaren direkta svar på ställda frågor utan att själv i en avslutande fas behöva studera ett eller flera dokument. Juridiska informationssökningssystem av faktasökande typ är ännu fåtaliga och av specialiserat slag. Bakgrunden till detta förhållande skall närmare beröras nedan. Exempel är de tidigare nämnda kommersiella systemen för skatteplanering (SvJT 1970 s. 289) och ett nedan närmare behandlat projekt på experimentstadiet utvecklat vid Link Information Sciences (USA).13
    Den grundläggande skillnad mellan system av typ LRS och CREDOC å ena sidan och LITE-systemet å den andra som ovan berörts (närmast frågan om manuell indexering) får ofta bilda utgångspunkt för en allmän diskussion kring juridiska, automatiserade informationssökningssystem. Man talar om deskriptormetoder respektive fulltextmetoder. I det förra fallet sker manuellt en genomgång av varje dokument14 och dokumentet klassificeras med en eller flera deskriptorer (indextermer) tagna ur en given lista. Dokumenten re-

 

11 Om LITE se SvJT 1970 s. 284 not 63.

12 Databasens omfattning redovisas löpande i LITE Newsletter. Aktuell information ges i vol. 2, 1969, 8 o. 9. Databasen i Automated Law Searching omfattade i juni 1967 omkring 180 miljoner ord varav större delen utgjordes av lagtext. Se sammanfattningen hos A. David, La recherche documentaire automatique appliquée au droit i L'Informatique et le droit (anförd i not 2).

13 B. Sackman, Electrifying Legal Research, Law and Computer Technology 1968/3, s. 2 ff.

14 Som redan torde ha framgått av texten är begreppet 'dokument' något flexibelt. En närmare definition får ges med anknytning till ett givet dokumentationssystem. Ett dokument kan således vara en lag, en paragraf, ett rättsfallsreferat, en tidskriftsartikel etc.

Automatisk databehandlingsteknik inom juridiken 729presenteras i maskinminnet av de sålunda tilldelade deskriptorerna. I system av LITE:s typ överförs alla i dokumenten förekommande ord till maskinminnet och vid själva sökningen utnyttjas ett inverterat register (jfr ovan), där alla ord i textmassan med undantag för de tomma orden (jfr ovan) utgör deskriptorer och därmed sökenheter.
    Diskussionen kring de båda metoderna förs ibland alltför onyanserat och utan utblick mot den skala av möjligheter som står till buds förutom dessa båda extremer. Anhängare av deskriptormetoden pekar på fulltextmetodens kostsamhet både vad gäller överföring av texterna till maskinläsbar form och per sökning.15 Deskriptormetoden brukar å andra sidan beskrivas som föråldrad med hänsyn till den risk för informationsförlust, som ovan berörts, och den kostnadskrävande flaskhals som den manuella indexeringen utgör.16 Stundom anförs rent rättstekniska argument för den ena eller andra lösningen.17
    Härtill skall för det första sägas, att uppdelningen i deskriptormetoder och fulltextmetoder (med ovan angivna innebörd) är grov och inte uttömmande. Man skall bl. a. uppmärksamma möjligheten att i maskinminnet lagra och vid sökning sammanställa information av deskriptortyp, vilken är resultat av manuell indexering, och fulltextinformation. Ett av IBM utvecklat dokumentsökningssystem, Document Processing System (DPS), rymmer möjligheter av detta slag. Här kan exempelvis lagras rättsfall i fulltextform och till varje rättsfall knytas ytterligare beskrivande (klassificerande, relaterande etc.) information i deskriptorform, varefter sökningen kan avse ord och ordkombinationer i texten och/eller deskriptorinformation. Kombinatoriska metoder av detta slag har, såvitt jag har kunnat finna, hittills inte prövats i någon större utsträckning eller diskuterats mer generellt i samband med juridiska, automatiserade dokumentationssystem.18
    Ytterligare skall uppmärksammas, att även i system där full text utgör indata den ursprungliga textmassan alltid reduceras, så att endast en mindre del utnyttjas vid själva sökningen. I LITE-systemet extraheras ett drygt hundratal tomma ord. Efter denna operation återstår endast omkring 55 % av den ursprungliga textmassan. I ett experimentellt system utvecklat i samarbete mellan American Bar Association och IBM (American Bar Foundation-IBM joint project)

 

15 E. Hoppenfeld, op.cit.

16 Se härom I. Kayton, op.cit. (not 2). Hänvisningen betyder inte att Kayton's framställning skulle vara onyanserad.

17 T. ex. A. David, op.cit. (not 12), s. 637—638.

18 Inom RI :projektets ram studeras den kombinatoriska metod som berörs i framställningen, jfr nedan. Se även J. Breton, Indexation par mot-clés ou texte intégral? Law and Computer Technology 1969/6, s. 24 ff.

730 Peter Seipelreduceras den ursprungliga textmassan genom statistisk bearbetning (ordfrekvensanalys) för sökändamål med omkring 70 %. Med utgångspunkt från den återstående ordbasen sker en maskinell indexering av avancerat slag, där dokumenten relateras till en 'semantisk rymd' och klassificeras genom anknytning till denna. Metoden har tydligen inte mycket släktskap med den av LITE utnyttjade, vilket inte utesluter beteckningen fulltextsystem eller partiellt fulltextsystem.19
    Det vore omöjligt att ge avsevärd omfattning åt en allmän diskussion om sättet att i datorminnet representera söksystemets textenheter (rättsfall, tidskriftsartiklar, etc.) och möjligheterna av olika automationsgrader vid databasens uppbyggnad. Med hänsyn till uppsatsens överblickande karaktär tvingas jag nöja mig med ytterligare några spridda synpunkter men vill framhålla att man här står inför problem, vilkas lösning får kritisk betydelse för söksystemets prestanda.20
    Vid uppbyggnaden av automatiserade dokumentationssystem är utgångspunkterna vad gäller de syften systemen skall tjäna av skiftande slag. Ur en synpunkt måste strävan vara att skapa effektivast möjliga samspel mellan i datamaskinen lagrad information och användarnas behov uttryckta i frågor av olika slag. Urvalet av information för lagring i datamaskinen liksom strukturen hos den lagrade informationen tilldrar sig stort intresse. I olika fall möter olika lösningar och synpunkter, vilket skall belysas med några exempel.
    Det tidigare (SvJT 1970 s. 276) berörda RIRA-systemet är ett deskriptorsystem i ovan angivna, snäva mening: målen (rättsfallen) klassificeras manuellt med deskriptorer tagna ur Uniform Issue List och frågan som kan ställas lyder: vilka mål har klassificerats med en viss deskriptor? Metoden fungerar relativt väl beroende på de begränsningar som gäller för dokumentationssystemet. Den ifrågavarande rättstillämpningen är av enhetligt slag och anknyter till ett avgränsat lagverk, vilket bildat bas för utformningen av deskriptorlistan (95,5 % av de aktuella rättsfallen har vid ett tillfälle uppgivits hänföra sig till Internal Revenue Code).21 LRS-systemet bygger även det på manuell indexering med utgångspunkt från en på förhand uppställd tesaurus. I detta system är svårigheterna större med hänsyn till det mer omfattande materialet i databasen. Man möter dem genom att avgränsa rättsområden och för varje område

 

19 Se t. ex. I. Kayton, op.cit. (not 2), s. 19.

20 Se vidare ex:vis N. Prywes, Information Storage and Retrieval i Survey of Cybernetics, ed. J. Rose, Iliffe 1969.

21 Se S. Furth, Automated Information Retrieval — A State of the Art Report, MULL dec. 1965, s. 214.

Automatisk databehandlingsteknik inom juridiken 731utforma speciella tesauri. All erfarenhet tyder på att denna väg måste följas så långt som möjligt. Genom att sammanhangen begränsas reduceras bl. a. de semantiska problem som anknyter till deskriptorval vid indexering och sökning.
    Även andra egenskaper hos LRS-systemet förtjänar uppmärksamhet. Sålunda skall dess effektivitet vad gäller mängden återvunnet, relevant material diskuteras i anslutning till användarnas sätt att utnyttja systemet. En undersökning har visat, att svaren till 40 % utnyttjas för kontroll av föregående utredning av konventionell typ och till 35 % för att ge utgångspunkter för sådan. Målsättningen för LRS har också uttryckligen begränsats till att ge stöd åt utredande insatser av traditionellt slag. Vidare har tillgången till rättsfallsreferat via mikrofilmbanken visat sig ha betydelse för önskan att utnyttja systemet; detta gäller mindre juristfirmor med små egna biblioteksresurser.
    Den mest väsentliga fördelen hos LRS-systemet torde dock ligga i möjligheten till kommunikation över telexnätet. Användaren kan föra en (om än tämligen primitiv) dialog med datamaskinsystemet och genom modifiering av den ursprungliga frågan förbättra resultatet av sökningen. Denna 'user feedback'22 har tillvaratagits än bättre i ett senare uppbyggt system, DIALOG Legal Reference System, använt vid NASA.23 Även i detta system representeras dokumenten i maskinminnet av en uppsättning manuellt åsatta deskriptorer, vilka återspeglar både juridiska begrepp och viss klasstillhörighet hos dokumenten. För varje dokument finns också en kort beskrivning av innehållet. 1968 uppgavs omkring 400 000 dokumentreferenser ingå i systemet. Användarnas kommunikation med datorn sker via terminaler med skrivmaskin och bildskärm. Tesaurus (deskriptorlistan) är lagrad i datamaskinen och på bildskärmen erhåller användaren information om besläktade deskriptorer och antalet dokument som klassificerats med olika deskriptorer och deskriptorgrupper. Deskriptorer kan kombineras med en söklogik av det slag som ovan (s. 727) berörts. Framsökta dokumentbeskrivningar studeras på bildskärmen och kan även skrivas ut på skrivmaskin. Större mängder text skrivs ut (off-line) vid själva datamaskincentralen.
    Att användaren har tesaurus automatiskt tillgänglig i datamaskinsystemet underlättar väsentligt utformningen av effektiva frågor till systemet. I detta hänseende uppvisar LITE (åtminstone i 1967 års version) en stor svaghet. Antag att användaren vill begagna ordet

 

22 Jfr G. Salton, Automatic Information Organization and Retrieval, s. 513.

23 G. Kondos, Dialog: Computer-Assisted Legal Research, On-line, Law and Computer Technology 1968/11, s. 8 ff.

732 Peter Seipel'officer' (eng.) som sökbegrepp. Han måste då också själv fundera ut och ange ord som begreppsmässigt är relaterade till 'officer' och ur söksynpunkt likvärdiga med detta — t. ex. 'agent'. Än mer besvär vållas användaren genom att han också måste ange pluralformerna 'officers' och 'agents' för att inte dokument där enbart dessa förekommer skall utelämnas. Senare utvecklade system med samma grundläggande struktur som LITE (bland dem DPS) ger möjligheter att bygga upp synonymlistor24 och hålla dessa tillgängliga i datamaskinsystemet, varigenom användarnas frågor automatiskt kan expanderas. Olika böjningsformer etc. med samma ordstam behöver heller inte bekymra användaren i system av modernare snitt: sökordet kan sålunda skrivas på formen 'KÖP( + )', varvid alla ord som innehåller stammen 'KÖP' kommer att anses relevanta vid sökningen, t. ex. KÖPET, KÖPETS, KÖPMAN. Motsvarande gäller i fråga om prefix.
    För framställning av tesauri har olika vägar prövats. Ofta har man gått rent manuellt till väga, men datamaskinen har i vissa fall tagits i bruk. Så har t. ex. skett i det tidigare nämnda American Bar Foundation — IBM projektet, där 'associationskartor' (grupperingar av ord efter deras förmodade betydelsemässiga inbördes samband) har framställts uteslutande genom statistisk bearbetning av textmassan med datamaskin.25 För att bedöma metodens effektivitet har ett parallellt arbete utförts, där manuell bearbetning föregår den i datamaskinen. Härvid kan bl. a. homonymernas problem (ord som skrivs lika men har olika innebörd t. ex. 'MEN' som konjunktion respektive substantiv [= skada]) behandlas, vilket inte var möjligt inom ABF—IBM projektets ram.26 Den gjorda jämförelsen visade, att insatsen av manuell (semantisk) bedömning och gruppering av orden gav god utdelning — så god att det naturliga konstaterandet blir, att vägen ännu är lång till en texthantering som är uteslutande datamaskinanknuten. Liknande synpunkter framförs ofta i mer allmänna sammanhang än de nu behandlade, när automatisk indexframställning, automatisk språköversättning och annan bearbetning av naturlig text med datamaskin diskuteras.27 Den hjälp som kan erhållas redan med nuvarande programmeringsteknik och datama-

 

24 Synonymer får här definieras som ord, vilka frågeställaren godtar som i princip lika relevanta för hans fråga som det i första hand givna sökordet.

25 I princip gäller, att ord som med viss grad av regelbundenhet uppträder tillsammans i t. ex. ett dokument (eller någon annan enhet inom textmassan) anses vara betydelsemässigt närstående. Se W. Eldridge, S. Dennis, op.cit. s.92, 95 (med hänvisningar).

26 I. Kayton, op.cit. (not 2) s. 31 ff (särskilt not 69 s. 38).

27 Libraries of the Future, s. 131 ff. N. Lindecrantz, op.cit. s. 53.

Automatisk databehandlingsteknik inom juridiken 733skinutrustning är å andra sidan avsevärd, vilket visas såväl av Kayton's arbete (jfr not 26) som av den fas av ABF—IBM projektet, där reducering av textmassan till en mindre uppsättning sökord sker (jfr ovan s. 730).
    Tesaurusframställning i dokumentsökande system innebär försök att beskriva vissa strukturer hos den information som lagras i datamaskinminnet — närmast vad som ovan betecknats som synonymrelationer. I faktasökande system och i dokumentsökande system av mer avancerat slag än t.ex. den enklaste typen av fulltextsystem, där utsökning endast kan ske enligt nyckelordskombinationsmetoden, måste analysen och organisationen av informationsmängden i datamaskinens minne föras än längre. De samband som härvid måste studeras har redan till viss del behandlats i avsnittet om ADB-teknik i samband med normutformning och normtillämpning (SvJT 1970 s. 281 ff). Systemuppbyggnaden förutsätter att det framtida utnyttjandet kan bedömas och beskrivas med hög precision, att noggrann yttre avgränsning kan göras av den aktuella tillämpningen och att elementen i den ingående informationsmängden och dennas struktur är väl kända och kan ges en formell beskrivning. I systemet måste finnas deduktiva funktioner, vilka saknar motsvarighet i de tidigare behandlade, enkla dokumentsökningssystemen. Analogt gäller, att lagringssättet i datamaskinens minne är av mer komplicerad natur.28
    Det tidigare nämnda (ovan s. 728) LADS-systemet illustrerar vissa typiska drag hos faktasökande system av f. n. vanligt slag: 1. Användaren för via en terminalskrivmaskin en dialog med datamaskinen, där frågor och svar direkt kan utväxlas. 2. Kommunikationen mellan användaren och datamaskinsystemet är starkt formaliserad. Användaren inleder genom att ställa en fråga ur en på förhand angiven och begränsad frågemängd och besvarar därefter med ja eller nej en frågeföljd från datamaskinen, vilket innebär en förflyttning genom den trädstruktur till vilken normkomplexets villkoråtgärdsmönster överförts vid lagringen i datamaskinens minne. 3. Söktiden är kort. Preliminära resultat (som dock med hänsyn till databasens obetydliga omfattning måste tas med stor försiktighet) tyder på att kostnaden per sökning blir lägre än i dokumentsökningssystem av ovan beskrivna typ — även med beaktande av kostnaderna för själva uppbyggnaden av informationssökningssystemet (vilka är betydligt högre för det faktasökande systemet).29

 

28 Jfr Libraries of the Future, s. 7 ff.

29 B. Sackman, op.cit., s. 6.

 

47—703005. Svensk Juristtidning 1970

734 Peter Seipel    Tidigare (SvJT 1970 s. 290) har framhållits, att den juridisktekniska analysen spelar en väsentlig roll redan vid enklare former av datamaskinanvändning vid behandling av normativt material. Tesaurusproblemet, vilket har aktualitet vid såväl dokumentsökande som faktasökande system, ger exempel på detta. Begreppsförteckningen i en tesaurus kan kompletteras med speciella kodbeteckningar, vilka utnyttjas för att ange termernas (begreppens) logiska och syntaktiska roller. Härigenom kan precisionen i beskrivningen av dokument och sökfrågor ökas. Med samma syfte har man sökt utveckla speciella, logiskt entydiga språk för återgivning av information i dokument. Som exempel kan nämnas ett vid Western Reserve University utfört arbete avseende delar av Uniform Commercial Code och en uppsättning anknytande rättsfall. Metoden innebär i princip, att en inledande manuell indexering företas, vars resultat bearbetas av datamaskinen och för lagring i minnet överförs till en s. k. semantisk kod — ett formelliknande språk, i vilket deskriptorerna brutits ned i grundläggande logiska beståndsdelar, vilka anges med kodbeteckningar och till vilka anknyter syntaktiska rollbeteckningar.30 Ett entydigt informationssökningsspråk av enklare slag har skisserats av professor Layman Allen (jfr SvJT 1970 s. 287 not 70). I detta överförs i en första fas meningar i dokumenten (manuellt) till en normaliserad, implikativ (om/rekvisit/ så /handlingsmönster/) form och enheter som tillförs informationssökningssystemet länkas till rekvisit- och handlingsmönsterdelar hos tidigare tillförda enheter.31 I sammanhanget skall också noteras, att man inte kan utesluta att det arbete som bedrivs i skärningen mellan den moderna (deontiska) logiken och rättsfilosofien kan komma att få praktisk betydelse för möjligheterna att i de sammanhang vi här diskuterar analysera och beskriva normkomplex.32
    Försöken att utveckla språk för koncis och entydig återgivning av juridisk information har även anknutit till rättspraxis. Insatserna ligger på olika plan. I vissa fall företas en konventionell utredning varvid ett förenklat skrivsätt införs för att redovisa resultaten.33 I

 

30 J. Melton, The Semantic Coded Abstract Approach, MULL mars 1962, s. 48 ff.

31 L. Allen, A. Language-Normalization Approach to Information Retrieval in Law, The American Political Science Association 1966 (stencil) och densamme, Sketch of a Proposed Semi-Automatic, Hierarchical Open-Ended Storage and Retrieval System for Statute-Oriented Legal Literature, Proceedings of the 1965 Congress of the International Federation for Documentation.

32 Om den deontiska logiken se allmänt t. ex. von Wright, Logik, filosofi och språk, Stockholm 1965, s. 101, 106—110 med vidare hänvisningar. Vidare Makkonen, op.cit., s. 218 ff och Communication Sciences and Law, Part III— särskilt A. Anderson, The Logic of Norms, s. 69 ff.

33 Se t. ex. J. Menke, Symbolic Logic and Judicial Communication, MULL juni 1966, s. 78.

Automatisk databehandlingsteknik inom juridiken 735andra fall är strävan primärt att utveckla nya metoder för själva bearbetningen av rättsfallsmaterialet. Med anknytning till faktasökande system kan det arbete som utförts av amerikanerna F. Kort och R. Lawlor presenteras.34 Både Kort och Lawlor utgår från domslutet som primärt bestämt av de rättsfakta och bevisfakta som redovisas i rättsfallsreferaten. Vid en manuell bearbetning analyseras och grupperas fakta och varje rättsfall återges som ett matematiskt (Kort) respektive rent logiskt (Lawlor) uttryck, där vänstra ledet representerar fakta i målet och högra ledet utgången.35 Genom bearbetning av de erhållna, formaliserade rättsfallsbeskrivningarna —varvid datamaskinen är ett nödvändigt hjälpmedel — söker man utreda praxis' ståndpunkt. Metoderna betraktas som hjälpmedel sidoordnade med mer traditionella tillvägagångssätt. Såväl Kort somLawlor har starkt understrukit den formella analysens begränsningar— framför allt att metoderna endast kan bidra till att belysa tillståndet hos ett vilande rättsläge. Främst Lawlor's metod syns ha förutsättningar att kunna utnyttjas som ett rättsvetenskapligt instrument.36 Ett exempel på en frågeställning där metoden givit intressanta resultat gäller den grad av säkerhet med vilken förutsägelser om rättsavgöranden (inom ett givet rättsfallsmaterial) kan göras med hänsyn till antalet föreliggande rättsfall och rättsområdets karaktär.37 Lawlor's metod att formellt beskriva rättsfall har även uppmärksammats för användning i informationssökningssammanhang: tanken är att lagra rättsfallen i datamaskinens minne i form av matriser med två-värda element (varje element kan vara antingen sant eller falskt), där varje rad representerar ett rättsfall och varje kolumn ett rättsfaktum eller bevisfaktum.38

 

34 F. Kort, Content Analysis of Judicial Opinions and Rules of Law i Judicial Decision-Making, ed. G. Schubert, London, 1963. Densamme, Simultaneous Equations and Boolean Algebra in the Analysis of Judicial Decisions, Jurimetrics, s. 143 ff. R. Lawlor, Foundations of Logical Decision Making, MULL juni 1963, s. 98 ff. Densamme, Analysis and Prediction of Judicial Decisions-Informal Progress Report, MULL sept. 1965, s. 64 ff.

35 Korts rättsfallsrepresentationer bildar tillsammans ett ekvationssystem av första graden, där i varje ekvation högra ledet anger antalet domarröster för en viss rättsutgång och ekvationssystemets lösning leder till att fakta tilldelas numeriska vikter, vilka anses spegla deras betydelse för rättsutgången. Lawlor framställer domslut och fakta i varje mål i form av logiska uttryck (ett uttryck för varje domare), vilka bearbetas och förenklas enligt den tvåvärda, logiska algebrans regler.

36 Korts metod lider av svagheten att endast förutsätta rent additiva samband mellan fakta; när tillräckligt antal tillräckligt tungt vägande fakta föreligger skulle domslutet gå i en viss riktning.

37 Jfr J. Goulet, op.cit., s. 30 med vidare hänvisningar i not 80.

38 W. Grunbaum, Search Criteria as Boolean Functions, Jurimetrics Journal dec. 1966, s. 36 ff.

KWOC - INDEX
BER - BET

 

 

Utdrag av KWOC-register över vissa centrala förmögenhetsrättsliga lagar.

Automatisk databehandlingsteknik inom juridiken 737    Den föregående framställningen torde ha visat att en mängd olikartade problem sammanhänger med utvecklingen av automatiserade, juridiska informationssökningssystem. I sammanfattande syfte är det lämpligt att skilja mellan 'allmänna problem' och 'tillämpningens speciella problem'. Inom den första problemgruppen riktas intresset mot tillgänglig datamaskinutrustning och programmeringsteknik. Frågorna gäller t. ex. vilka minnestyper och vilka standardprogram för informationssökning som finns tillgängliga. De gäller allmänna erfarenheter av t. ex. maskinell indexering, av olika metoder att lagra information i datamaskinens minne och av olika sökstrategier. Problemen inom den andra gruppen hänger intimt samman med de först nämnda. De gäller användarkretsens storlek och kraven på svaren, de gäller frågornas form och deras fördelning i tiden liksom karaktären hos den information som skall ingå i söksystemet; varifrån den skall hämtas, i vilken form den är tillgänglig och hur den bör lagras och kommuniceras med användarna. Främst inom ramen för RI har bearbetningen av dessa frågor inletts för den svenska rättsordningens del. Arbetet har ännu inte lett fram till i egentlig menig operativa rutiner, vilket inte utesluter att värdefulla, grundläggande erfarenheter nu hunnit göras.

 

3. Svenska erfarenheter
Det första steget inom RI-projektet "ADB av lagtext m. m." avsåg produktion av ett nyckelordsregister (ett s. k. KWOC/Key Word Out Of Context/-register) till en grupp förmögenhetsrättsliga lagar, närmare bestämt avtalslagen, köplagen, lagen om avbetalningsköp, försäkringsavtalslagen, skuldebrevslagen och kommissionslagen, sammanlagt omkring 26 000 ord lagtext.39 I registret förtecknas i alfabetisk ordning alla ord i textmassan som inte utrensats såsom tomma ord (jfr ovan). För varje sökord anges alla de ställen (paragrafer) där ordet förekommer jämte ett fragment av den närmast omgivande texten i syfte att underlätta för läsaren att fastställa sökordens närmare innebörd. Exempel (ej helt autentiskt, jfr motstående sida):

 

INNEHÅLLA
om rätt att innehålla godset eller köpeskillingen    Köpl 14 §
innehålla det mottagna till dess huvudmannen    KommL 74 §
slutsedelsblanketter, vilka innehålla huvudmannens    KommL 88 §
Man kan ställa frågan varför den första ansträngningen kom att gälla något till synes så enkelt som en ordlista till en grupp lagar, vilkas innehåll är välkänt för jurister. Svaret är belysande för ar-

 

39 Lagkomplexet valdes med syfte att skapa goda förutsättningar för analys och utvärdering av det framställda registret (jfr nedan).

738 Peter Seipelbetets inriktning och svårighetsgrad och skall här utvecklas med viss utförlighet.
    Mycket tyder på att det är angeläget att redan från starten ägna uppmärksamhet åt de problem som sammanhänger med överföring av juridisk fulltext till maskinläsbar form för lagring och bearbetning i datamaskin. Särskilt skall följande framhållas.40
    a) Ett flertal färdiga datamaskinprogram för produktion av s. k. permuterade index av KWOC-registrets typ finns tillgängliga, vilket håller kostnaderna för ett inledande projekt nere samtidigt som viktiga erfarenheter kan vinnas.41 I detta fall utnyttjades ett programutvecklat vid AB Atomenergi under överbibliotekarie Björn Tells ledning.42 Det allmänna synsättet är, att insatser av enklare slag måste föregå mer avancerade former av datamaskinutnyttjande. Många praktiskt betydelsefulla frågor kan bearbetas utan att målsättningen för datamaskininsatsen i och för sig är särdeles ambitiös.
    b) Man kan förutsätta att det centrala juridiska dokumentationssystem som efterhand byggs upp kommer att omfatta ett flertal delprogram och betjäna olika användarbehov. En viktig funktion kommer med säkerhet att vara produktion av register av olika slag för manuell användning. Det innebär således inte arbete i en återvändsgränd att i en första etapp utveckla program för registerproduktion. F. n. gäller att denna verksamhet ofta intar den viktigaste platsen i automatiserade dokumentationssystem, som även ger möjlighet till automatiserad sökning.43 I LITE-systemet spelar således indexproduktionen den centrala rollen. I april 1967, när uppsatsförfattaren hade tillfälle att stifta bekanskap med systemet, var frågefrekvensen till det automatiserade dokumentsökningssystemet så låg som 10 frågor per dag (jfr om databasens omfattning ovan). Exemplet (som inte är isolerat) illustrerar med tydlighet den självklara nödvändigheten av en noggrann analys av de större sammanhang, inom vilka dokumentationssystemet skall verka. Den låga frågefrekvensen förklaras troligen till stor del av att LITE-systemet inte ger möjlighet till dialog mellan användare och datamaskin; svarstiden är minst ett dygn lång och skriftliga frågor måste insändas till datamaskincentralen i Denver, Colorado. Mot denna bakgrund framstår en (ofta okritiskt citerad) undersökning av systemets 'effektivitet', där manuell sökning jämfördes med maskinell

 

40 Jfr P. Seipel, Synpunkter på automatiserade juridiska dokumentationssystem, Kgl. Statskontoret 1968 (stencil).

41 M. Cox, J. Dews, J. Dolby, The Computer and the Library, Newcastle upon Tyne 1966, s. 84 ff.

42 B. Tell, Abacus, Biblioteksbladet 1968/1—2, s. 21 ff.

43 Jfr Cox, Dews & Dolby, op.cit., s. 82. Även Salton, op.cit., s. 300 ff, särskilt s. 364 ff (om auxiliary information services).

Automatisk databehandlingsteknik inom juridiken 739vid 215 testfrågor och överlägsenhet konstaterades för datamaskinens del, såsom mycket ofullständig.44 Undersökningen kan även kritiseras emedan den endast befattar sig med frågan om antalet återvunna, relevanta dokument i förhållande till totala antalet relevanta dokument ("recall") men inte säger något om förhållandet mellan antalet relevanta respektive icke-relevanta dokument i svaren ("precision").
    I fråga om indexproduktion gäller, att fulltext i databasen ger goda möjligheter till variation av innehåll och utseende hos produkterna.45 Förutsättningar erhålls också för automatiserad indexering och referatframställning, vilket dock ännu inte aktualiserats inom RI-projektets ram.
    c) Datorsystemets förhållande till den process där författningar tillkommer, trycks och publiceras bör uppmärksammas redan i ett inledande skede.46 De olika leden i denna process måste nära samordnas och författningstexterna tidigt överföras till maskinläsbar form för olika slag av bearbetning i datamaskinen. Att som i det inledande projektet hålkortsstansa texten från en konventionell tryckt förlaga för efterföljande lagring på magnetbandsminne är endast tänkbart så länge texternas omfattning är begränsad. Mycket snart blir det aktuellt att pröva mer avancerade metoder för införing av författningstexterna i datamaskinsystemet. Detta motiveras bl. a. av den dyrbara och tidsödande kontrollen av stansningsfel.
    Redan mot bakgrund av dagens teknik och erfarenheter är det naturligt att tänka sig en central roll för datamaskinen vid tillkomsten och utnyttjandet av författningar. Några synpunkter kan belysa detta.
    Tidigt under en författnings tillblivelse kan datamaskinen tas i bruk. Sedan en grundtext placerats i maskinminnet kan ändringar etc. utföras direkt på den minneslagrade versionen och aktuella utskrifter kontinuerligt tas fram. Genom att författningstexten hålls tillgänglig i datamaskinen får redan lagstiftaren möjlighet till registerframställning och annan bearbetning. På ett senare stadium kan i maskinminnet finnas lagrade gällande och tidigare lydelser av författningstexter. Ständigt aktuella register kan med stor flexibilitet

 

44 Se The United States Air Force Law Review 1966/6, s. 8 ff.

45 Jfr Kayton, op.cit., s. 16. Den lay-out som utnyttjas i KWOC-register är endast en variant av många möjliga. En vanlig form är KWIC (Key Word in Context)-registret, som har följande uppställning:

om rätt att      innehålla godset eller köpe- KöpL 14 §

skulle äventyras      innehålla det mottagna till KommL 74 §

blanketter vilka      innehålla huvudmannens namn KommL 88 §

46 Ett sådant större perspektiv är aktuellt inom RI och bl. a. pågår samarbete mellan dokumentationsenheten och den utredning om författningspublicering som inlett sitt arbete år 1967.

740 Peter Seipelproduceras till olika rättsregelsektorer. Program för utsökning av speciell information (typen: i vilka lagar finns bestämmelser som berör bokföringsskyldiga) finns tillgängliga. Förändringar i författningstexterna införs direkt i den datamaskinlagrade versionen och denna utnyttjas vid tryckning av författningar. Speciella program svarar för selektiv delgivning av register och författningstexter till olika intressentgrupper. Tankegångar som dessa är aktuella i flera länder, varvid man vanligen inriktar sig på att tillskapa ett centralt organ med ansvar för datamaskinsystemets olika funktioner.
    d) Bland faktorer av betydelse för valet av arbetsinriktning vid det inledande försöket bör också nämnas behovet av lagregister av KWOC-registrets typ. De manuellt framställda register som f. n. finns till olika lagsamlingar har genomgående tämligen låg kvalitet. Någon systematisk undersökning av förhållandena har inte gjorts, men resultat av punktvisa granskningar pekar i denna riktning. I Sovjetunionen har genomförts en större undersökning av på traditionell väg framställda sakregister till en omfattande grupp lagar (inalles 1286 stycken).47 Resultaten är intressanta att ta del av och är troligen belysande även för förhållandena i Sverige. Det visade sig att vissa lagkomplex alls inte indexförts. Flera uppslagsord (indextermer) uppträdde endast i vissa årgångar av lagutgåvorna för att sedan bytas ut mot andra. Somliga indextermer med mycket vid innebörd användes trots detta bara för klassificering av ett fåtal lagar (ex. 'samhälleliga organisationer', 'avskedande'). Ord med samma eller delvis samma innebörd utnyttjades som fristående indextermer (ex. 'vetenskapliga inrättningar'/'forskningsinstitutioner'). Vissa indextermer ansågs ha en alltför snäv innebörd ('stämning av flyglar', 'foderkakor'). Mer än 1/3 av indextermerna hänvisade endast till en lag. Däremot var endast ett fåtal för vida — fyra hänvisade till fler än 100 lagar.
    Ett behov av systematiskt bedrivna insatser för sakregister- och tesaurusframställning föreligger utan tvekan. Härvidlag utgör nyckelordsregister av KWOC-typ ett gott hjälpmedel. Registret kan direkt eller efter viss redaktionell putsning utnyttjas som ett detaljerat sakregister. Det kan också ge en grund för mer omfattande manuell bearbetning med syfte att utreda terminologiska spörsmål och ingående studera tesaurusframställningens problem. Det första KWOC-registret har gjorts till föremål för en förberedande genomgång av detta slag av professor Jan Hellner vid Stockholms univer-

 

47 A. Randalu, Den juridiska informationstjänstens organisation, Sovjetskoje Gosudarstvo i Pravo 1967/3, s. 124.

Automatisk databehandlingsteknik inom juridiken 741sitet.48 Trots sitt begränsade syfte visar undersökningen, att den enkla ordlistan i händerna på en erfaren rättsvetenskapsman utgör ett kraftfullt verktyg med flera användningsområden, vilka sträcker sig från utredning av enklare terminologifrågor till analys av lagarnas struktur och användningen av rättsliga begrepp. Fortsatta och breddade insatser i denna riktning är angelägna och möjligheter kommer att skapas genom fortsatt KWOC-registerproduktion. Härvid är det angeläget att användarsynpunkter — med såväl praktisk som rättsvetenskaplig orientering — kontinuerligt insamlas och bearbetas. Dessa kan nyttiggöras inte bara i den löpande framställningen av lagregister utan också vid vidareutvecklingen av det totala, automatiserade informationssökningssystemet.
    e) Urvalet av tomma ord utgör en viktig del av det program som producerar KWOC-register. Nyckelordsregistret blir lätt alltför voluminöst och därmed dyrbart att framställa och svårt att använda. Möjligheter till begränsning ligger dels i en registerproduktion som uppspaltas på flera mindre lagkomplex, dels i konstruktionen av speciella ordvalslistor (= förteckningar över tomma ord) för olika lagkomplex och användarkategorier. Hur långt man skall gå i sistnämnda hänseende är en avvägningsfråga. I princip ställer sig saken enkel: en del av ordvalslistan (således listan som extraherar ur söksynpunkt icke-relevanta ord) är gemensam för de flesta tillämpningar. Andra delar är mer eller mindre specifika för varje särskild tillämpning.49 Svårigheterna är emellertid i praktiken inte obetydliga, vilket klart demonstrerats vid framställningen av det första nyckelordsregistret.
    Det använda programmet utnyttjar i originalversion en ordvalslista på drygt 600 ordstammar vad gäller bearbetning av svensk text. Denna ordstamlista kombineras med en suffixlista och en ändelselista. Som ett exempel kan nämnas att ordstammen 'ANVÄND' kommer att kombineras med suffixet 'BAR' och ändelsen 'T' och spärra ut ordet 'ANVÄNDBART'. Sammanlagt finns 18 suffix och 79 ändelser i de listor som kompletterar den nämnda ordstamlistan. För att skapa en ordvalslista lämpad för lagtext måste programmets originallista kraftigt omarbetas. Vissa ord kan antas inte alls förekomma i lagtext eller om de förekommer ha visst informationsvärde trots låg frekvens. Exempel är 'fenomen', 'randvillkor', 'höstmöte'. Å andra sidan måste en lång rad för lagtexten karaktäristiska och

 

48 J. Hellner, Analys av lagtext med hjälp av datamaskin i Nordisk Gjenklang, Festskrift till C. J. Arnholm, Oslo 1969.

49 Jfr G. Salton, op.cit., s. 25 ff.

742 Peter Seipelspeciella ord fogas till originalprogrammets lista, t. ex. 'framdeles', 'annorstädes', 'någondera', 'evad'. I vissa fall är ord som i originalprogrammet inte betraktas som signifikanta av direkt intresse i det juridiska sammanhanget. Det gäller t. ex. ordet 'tredje', då sammanställningen 'tredje man' endast kan nås genom det adjektiviska räkneordet; pronominet 'man' (med hög frekvens och lågt informationsvärde) måste spärras ut genom ordvalslistan. Det gäller 'fullbordad','underhåll' och 'medel'. I ett stort antal fall kan man inte lika klart bestämma ordens informationsvärde. Detta sammanhänger i stor utsträckning med avsaknaden av klart definierade användarönskemål i ett inledande försök av det slag som utförts inom RI. Man skall sålunda uppmärksamma, att den som undersöker lagarnas språkbruk, den som arbetar med ett konkret rättsligt problem och den som använder ett KWOC-register som underlag för framställning av ett traditionellt sakregister av den typ som finns t. ex. i Svensk Författningssamling har helt olika önskemål och synpunkter på informationsvärdesfrågorna. Några bestämda antaganden om användarönskemål gjordes inte under arbetet med det första KWOC-registret. Resultatet skall heller inte betraktas som en färdig produkt utan endast som ett mellanresultat: de föregående försöken med ordvalslistor av olika omfattning kom aldrig att ges någon större omfattning.
    Vid det inledande försöket uppstod ett särskilt problem genom ordstamlistans kombination med suffixlista och ändelselista. Såväl själva lagtexten som de sammanhang i vilka den används har särpräglad karaktär. Man kan allmänt förutsätta, att antalet tomma ord i främst kategorierna substantiv, adjektiv och verb är lägre än vid många andra typer av text.50 Samtidigt gäller, att kontrollen över vilka ord som faktiskt spärras ut av ordvalslistan måste ägnas större uppmärksamhet än i den biblioteksrutin för vilken KWOC-programmet ursprungligen utvecklats. Några exempel kan belysa detta. Ordet 'egen' som vore naturligt att spärra ut kommer om det placeras i ordstamlistan att ge upphov till kombinationerna 'egendom', 'egendomens' etc., vilkas inlemmande i listan är mindre självfallet. Prepositionen 'för' kombineras till 'förare' (med böjningsformer), 'ock' till 'ocker', 'par' (= paragraftecken) till 'part', 'är' till

 

50 Sålunda utnyttjar LITE-systemet en mycket begränsad ordvalslista — i svensk översättning och bearbetning omfattar den endast 97 ord. Denna lista är dock i huvudsak tänkt att göra tjänst vid automatisk sökning med nyckelordskombinationer, varvid synpunkterna är något andra än vid system begränsade till produktion av register för manuell användning.

Automatisk databehandlingsteknik inom juridiken 743'ärende', 'var' till 'vara', 'varor' etc. Ordet 'en' ger upphov till hela 28 betydelsebärande varianter, av vilka inte alla är självklara för placering i ordvalslistan. Andra exempel är 'med' som ger 'medling' och 'medel', 'mot' som ger 'motiv', 'ny' som ger 'nyval','åt' som ger 'åtal'. Ibland uppstår avvägningsfrågor av intrikat slag. Sålunda förefaller substantivet 'lag' ha tämligen lågt informationsvärde (hög frekvens; har inkluderats i LITE-systemets ordvalslista) medan däremot kombinationerna 'laglig(t)', 'lagligen' snarast bör hållas utanför ordvalslistan.
    En annan sida av problemet sammanhänger med att den givna ordvalslistans kombinationsmöjligheter vad gäller lagtext inte förefaller utnyttjas i full utsträckning. Bland de använda ordstammarna gav endast en tredjedel upphov till kombinationer och i dessa kombinationer utnyttjades endast en mindre del av tillgängliga suffix och ändelser (ungefär hälften av suffixen respektive ändelserna). Alla de utnyttjade suffixen och drygt hälften av ändelserna förekom i endast fyra eller färre kombinationer. Endast sex ändelser förekom i fler än 20 kombinationer. Ändelsen '-A' ensam förekom i fler än 30 kombinationer. Genom framställning av ett första lagregister blev dessa förhållanden möjliga att klarlägga. Granskningen av resultaten har lett till att nackdelarna med en tredelad ordvalslista vad gäller lagtext ansetts överväga fördelarna varför man för det fortsatta arbetet kommer att pröva en teknik med en enda lista, i vilken olika böjningsformer etc. får anges explicit. Att på förhand förutse omfattningen av nackdelarna med en tredelad lista var knappast möjligt. Det praktiska arbetet fick här ge anvisning om lämpligaste, framtida tillvägagångssätt, vilket även i många andra frågor lär bli fallet.
    Parallellt med utvecklingen av rutiner för registerproduktion bedrivs inom RI försöksverksamhet med ett standardsystem för automatiserad informationssökning. Systemet har utvecklats av IBM och har beteckningen Document Processing System (DPS). Den filosofi som bestämt detta arbetssteg äger stora likheter med den för KWOC-registrets del beskrivna. Man söker således undvika kostnadskrävande egen programmering för att i stället i största möjliga utsträckning göra de första erfarenheterna med tillgängliga programpaket (vilket inte innebär att man binder sig för att utnyttja dessa i framtiden). I det inledande skedet är avsikten att få praktiska erfarenheter av den tillämpade informationssökningsmetodens fördelar och svagheter samtidigt som rent ADB-tekniska frågor bearbetas. På den juridiska sidan hålls målsättningen till en början låg: de studerade problemen har begränsad omfattning och detaljplaner för den fortsatta

744 Peter Seipelutvecklingen av söksystemet och dess inplacering i juridiska aktiviteter förutsätts bli utformade först i ett senare skede.50a
    Den teknik som utnyttjas i DPS har ovan i korthet berörts (s. 727, 732). Det är således fråga om ett fulltext-system, i vilket sökning sker genom formulering av frågor som nyckelordskombinationer. Som jag tidigare nämnt kan synonymlistor (högst två) byggas in i systemet, genom vilka användarnas frågor automatiskt kan expanderas med åtföljande förbättring av sökresultatet (ökad "recall" jfr ovan s. 738). Dokumenten är uppbyggda av två delar, en "formatiserad" del med uppgifter av typen 'författare', 'datum' och en "fri" del, som innehåller löpande text.51 Det minneslagrade materialet är uppdelat på ett antal databaser, vilka innehåller olika typer av information. F. n. ingår (a) en databas omfattande författningstexter,(b) en databas omfattande rättsfall och (c) en databas omfattande information om kommittéverksamheten inom justitiedepartementet. I varje databas förekommer dokument av olika typ. Databasen (a) innehåller således fem olika dokumenttyper: förutom dokument som rymmer författningarnas löpande text ingår dokument vilka närmare beskriver varje enskild författning (rubrik, datum för utfärdande, uppgifter om förarbeten) och dokument som anger ändringar i varje författning i databasen i kronologisk ordning och i paragrafordning. Rättsfallsdatabasen innehåller information om HD:s domar i brottmål 1967 och om vissa regeringsrättsutslag i skattemål under samma period. De ingående fyra dokumenttyperna ger uppgifter bl. a. om referatrubrik samt författningshänvisningar och löpande referattext. I databas (c) slutligen ingår tre dokumenttyper, vilka beskriver direktiv och bakgrund (propositioner, motioner m. m.), förslag av kommittéer och uppgifter om arbetsplaner. Totalt omfattar databanken (i början av 1970) omkring en halv miljon ord.
    Utvecklingsarbetet inom RI är nära koordinerat med vissa utanförliggande projekt och utredningar. I de här behandlade sammanhangen skall främst uppmärksammas utredningen om ADB i riksdagsarbetet och utredningen om författningspublicering. Den förra utredningen går tillbaka på ett riksdagsbeslut 1966 genom vilket riksdagens förvaltningskontor fick i uppdrag att ombesörja en begränsad utredning om ADB-teknikens utnyttjande i riksdagsarbetet. Beslutet kom att leda till en demonstration av DPS i slutet av 1968 varvid

 

50a Sådana planer har lagts fram inom RI i november 1970 — alltför sent för att kunna beaktas i denna översikt.

51 Om DPS se I. Gardmo, C. Gissdal, DPS (Document Processing System), En beskrivning, Kgl. Statskontoret (Utredningen om ADB i riksdagsarbetet, PM nr 8, 13.11.69 /stencil/). Även A. Furth, Automated Retrieval of Legal Information: A State of the Art, Computers and Automation, 1968/dec., s. 25 ff.

Automatisk databehandlingsteknik inom juridiken 745databasen utgjordes av 1966 och 1967 års fristående motioner (omkring 2 500) jämte uppgifter om utskotts- och kammarbehandling. Som en uppföljning av det inledande projektet tillsattes 1969 utredningen om ADB i riksdagsarbetet med uppgift att verkställa en "fördjupad" förstudie avseende lagring och återvinning av information tillkommen såväl inom som utom riksdagen och möjligheter att utnyttja ADB för att utvärdera olika handlingsalternativ. Utredningen har när detta skrivs hunnit framlägga en första rapport, vilken huvudsakligen ägnas åt frågan om informationsåtervinning av riksdagens eget material och drar upp de stora linjerna för ett framtida, automatiserat informationssökningssystem för tillgodoseende av riksdagens behov. Utredningen urskiljer två huvudtyper av information nämligen "textinformation" (riksdagstrycket i dess helhet) och "processinformation" (uppgifter rörande handläggningen av riksdagsärendena). En genomgång av de manuella register som f. n. förekommer i riksdagsarbetet har lett utredningen till slutsatsen att ADB-tekniken kan åstadkomma radikala förbättringar. Man pekar härvid på en rad brister såsom otillfredsställande aktualitetsgrad hos tillgänglig information, avsaknad av slagordsdel hos diarier, alltför många registertyper och brist på terminologisk samordning mellan olika register. I den skiss till ADB-system som utredningen presenterar spelar samordningen av tryckningsrutiner och rutiner för registerframställning och automatiserad sökning en viktig roll. Samma databas skall således utnyttjas för olika ändamål varigenom kostnaderna för dess uppbyggnad och underhåll kan slås ut på olika användningar. Motsvarande tankegångar är aktuella också inom RI (jfr ovan s. 738). Utredningen beräknar att ADB-framställning av riksdagstrycket (automatiserad sättning) kommer att ställa sig omkring 20 % billigare än hittillsvarande tillvägagångssätt och rekommenderar därför en övergång till sådan teknik även om man inte skulle finna tiden mogen för automatiserad registerproduktion och informationssökning.52
    Inom utredningen om författningspublicering pågår bl. a. arbete med en ämnesindelning av Svensk Författningssamling, vilket kan komma att bli av väsentlig betydelse för klassificeringsrutiner i ett framtida ADB-system för juridiska texter. Man har också tagit upp frågan om behovet av olika typer av författningsregister: det pågående arbetet gäller bl. a. en förteckning över nu gällande författningar som tillkommit eller blivit ändrade efter 1920. Datorn kom-

 

52 Se Bankoutskottets utlåtande nr 37, 1969 och skrivelse till riksdagen från dess förvaltningskontor den 15.4.1970 (Dnr 97—F.2/70).

746 Peter Seipelmer här att tas i bruk för enklare sorteringsarbete i samband med registrets slutliga uppställning.52a Även inom RI-projektet föreligger framskridna planer på produktion av författningsregister, varvid avsikten bl. a. är att utnyttja det program som genererar KWOC-index till lagtexter (jfr ovan).
    Bland övriga aktiviteter utanför RI kan nämnas ett automatiserat söksystem för förväxlingsbara varumärken, vilket utvecklats för patentverkets varumärkesavdelning.53 Vid försäkringsdomstolen och riksförsäkringsverket pågår sedan början av 1969 försök med ett ADB-system för registrering av försäkringsdomstolens avgöranden. Systemet bygger på manuell indexering, där det använda klassningsschemat nära anknyter till de tillämpade lagreglerna. Systemet avser såväl att producera processtatistik som att möjliggöra enkel åtkomst a v tidigare avgjorda mål avseende en given rättsfråga. Utdata utgörs av systematiska förteckningar över avgjorda mål.

 

4. Sammanfattning
Under våren 1970 arrangerade "arbetsgruppen för ADB och juridik "vid juridiska institutionen i Stockholm en serie seminarier på temat automatiserad, juridisk informationssökning. Vid dessa seminarier diskuterades frågor om målformulering och om nödvändiga planeringsinsatser varvid ett antal problem av grundläggande betydelse kom att beröras. De gällde alla svårigheten att i ett inledande skede finna den rätta avvägningen mellan å ena sidan enkla datorrutiner som utan föregående omfattande planläggning och samordning tas i bruk för begränsade syften och å andra sidan utveckling av ADB-tekniskt avancerade lösningar med sikte på uppbyggnad av en omfattande, juridisk databank. Med utgångspunkt från denna avvägningsfråga vill jag ge några avslutande, sammanfattande synpunkter, vilka närmast hänför sig till den svenska situationen men också torde äga giltighet för den långa raden av utländska verksamheter på den juridiska informationssökningens område.
    Det är viktigt att understryka, att utvecklingen ännu befinner sig i ett begynnelseskede med allt vad det innebär av osäkerhet beträffande lämpligheten av olika ADB-tekniska lösningar och de vinster som är möjliga att uppnå jämfört med traditionella former för hantering av rättsliga informationsflöden av här behandlat slag. Det bör därför inte väcka förvåning att man i starten nöjer sig med att for-

 

52a Se numera utredningens betänkande Svensk författningssamling (SOU 1970: 48).

53 Programmet har utvecklats av H. Karlgren och B. Brodda vid språkförlaget Skriptor, Stockholm. Programmet finns översiktligt beskrivet i "Trade Mark Similarity Check by Computer", Skriptor 1968.

Automatisk databehandlingsteknik inom juridiken 747mulera och lösa relativt enkla uppgifter av typen "producera och visa nyttan av ett nyckelordsregister till lagtext" eller "åskådliggör praktiskt datateknikens möjligheter och begränsningar i samband med lagring och återvinning av riksdagsmotioner". De inledande ansträngningarna beskrivs och uppfattas genomgående som "förstudie", "försöksverksamhet" etc. och kostnaderna har i varje sammanhang varit relativt blygsamma. Inledande verksamhet av detta slag ger å andra sidan såväl värdefulla praktiska erfarenheter, vilka kan nyttiggöras i det framtida arbetet, som kunskaper av betydelse när verksamhetens fortsatta inriktning skall bestämmas. Detta gäller hela skalan av problem från de rent ADB-tekniskt orienterade till de specifikt rättsliga.
    Det är möjligt att fortsätta på den nuvarande vägen ännu ett stycke. Åtskilliga delfrågor kan utan vidare behandlas i den förstudiemiljö som f. n. är den förhärskande. Som ett exempel kan nämnas uppgiften att pröva andra utsökningstekniker än den som erbjuds av en renodlad nyckelordskombinationsmetod, t. ex. metoden att söka ut dokument efter deras plats i en hierarkisk struktur (frågor av typen: vilka rättsfall finns som citerar ett givet rättsfall?). Å andra sidan nalkas man snart den punkt där en väsentligt ökad planeringsinsats och samordning ter sig önskvärd. Detta förhållande kan belysas ur flera olika synvinklar. Således pågår f. n. internationellt sett ett omfattande dubbelarbete, vilket det vore önskvärt att undvika åtminstone inom de nordiska ländernas krets. Detta förutsätter i sin tur en intensifierad kontakt och gemensamt utvecklingsarbete. Ur en annan synpunkt ter det sig alltmer angeläget att kartlägga faktiska informationsbehov och informationsbehandlingsbehov inom olika sektorer av rättsordningen och dra upp gränser för ansvarsområden när det gäller det totala informationssökningssystemets utveckling. Allt detta är tveklöst på väg och framtvingas på viktiga punkter av konkreta, ekonomiska hänsynstaganden.54 Samarbetet mellan RI- och riksdagsprojekten intensifieras således efterhand och detsamma gäller kontakterna mellan de nordiska länderna. På det vidare internationella området kan nämnas samordningsarbetet inom

 

54 Jfr följande uttalande av utredningen om ADB i riksdagsarbetet (Riksdagens förvaltningskontors skrivelse, anförd i not 52, s. 21) : "I kostnadskalkylerna har förutsatts att kostnaderna för datorutrustning kan delas mellan flera användare, i första hand riksdagen och kanslihuset. Planeringen är således även beroende på om man inom utredningen om ADB av lagtext m. m. kommer fram till målsättningar som överensstämmer med riksdagens och att beslut om dessa fattas för statsdepartementen. Först sedan en samordning av målsättningar och beslut hos berörda parter skett kan beslut om upphandling av teknisk utrustning samt program för datasättning och informationsbehandling ske."

748 Peter SeipelEuroparådets "Committee of Experts on the Harmonisation of the Means of Programming Legal Data into Computers".
    Det är min uppfattning att man bör ta den tämligen långsamma och trevande utvecklingen av automatiserade, juridiska informationssökningssystem med stor ro. En viss tillvänjningsperiod i förhållande till de ADB-tekniska möjligheterna är nödvändig och denna kan t. o. m. med fördel utformas som en tid av experimenterande och prövning av den moderna databehandlingsteknikens möjligheter. Genom detta tillvägagångssätt infogas datorn på ett välgörande odramatiskt sätt i arsenalen av juridiska verktyg och dess praktiska nytta demonstreras till ett billigt pris genom enkla sorterings- och utsökningsrutiner. Å andra sidan växer aptiten och kunnandet och verksamheten leds naturligt över i nästa fas, där det blir aktuellt att fastställa bl. a. vilka områden som är mest lönsamma för datorinsats och ett mer systematiskt utvecklingsarbete tar vid. I denna fas skärps kraven på juristernas medverkan vid systemuppbyggnaden och ansvaret för resultaten blir i stor utsträckning deras eget. Det finns ingen allkunnig yrkeskår av informationstekniker som är i stånd att axla hela ansvaret och utan samverkan med fackets specialister utveckla lösningar för varje typ av databehandlingsuppgift — allraminst på det juridiska fältet.