Community på Sveriges dataportal

@björn-hagström sa i Önskemål: Ny rekommendation från DIGG om API:ers koordinatsystem:

Som jag ser det är det viktigt att man ska få experimentera och lära sig för att kunna bli bättre, att det ska bli perfekt på första försöket är inte rimligt. Perfektion är dock det ni förväntar er och det hindrar innovation och utveckling och det är ett jättestort problem.

Det skulle onekligen vara ett stort problem, eller ett symtom på sådant, om tusentals tjänstepersoner i den offentliga sektorn skulle avstå från att yttra sig eller visa intresse för innovation och utveckling på grund av vad två eller tre personer föreslår eller ifrågasätter som representanter för datakonsumenter och allmänhet på det här forumet. Tanken på en öppen kommunikation mellan tjänstepersoner och tjänstekonsumerande allmänhet förefaller väl i så fall helt orealistisk.

Ibland undrar jag om politiker i så fall skulle vara bättre lämpade i sin roll att föra öppna diskussioner som kan leda till åtgärder och framsteg.

@salgo60-ej-aktiv sa i Önskemål: Ny rekommendation från DIGG om API:ers koordinatsystem:

EU kör en wikibase se artikel "Wikibase as an Infrastructure for Knowledge Graphs: the EU Knowledge Graph" se linkedopendata.eu "The EU Knowledge Graph"

Väldigt intressant artikel om Wikibase som infrastruktur, den förklarar mycket om bakgrund, användning och de olika delarna i arkitekturen.

När det gäller "en del anpassningar" är det väl något som gjorts av DIGG på ett tekniskt plan, även om jag inte vet vad det innebär eller om det handlar om programmering. Tillgänglighetsdirektivet kanske inte säger något om att det ska gå att ångra ändringar vid redigering. Den plugin-kod som ligger på utvecklarens GitHub borde ju inte vara något problem att länka till.

@nina_ sa i Går ej att ångra efter formatering i editorn:

Problemet är "By design" från utvecklarna av pluginet (editorn).
Vi kommer inte åt denna kod på ett enkelt sätt då den ligger på en djupare nivå i pluginet.
Vi kan skriva om problematiken på deras GitHub, men det är inte självklart att de gör något åt det.
Ett annat alternativ är att vi tittar på ett annat plugin. Det vill vi helst undvika eftersom vi tycker det här funkar ganska bra och vi har gjort en del anpassningar för att kunna möta tillgänglighetsdirektivet.

Jag vill påpeka att ingen av referenserna som nämns går att härleda till något faktiskt existerande, och följdfrågor om precisering som skulle ge en möjlighet att följa upp problemet besvaras inte.

@nina_ Hej, Att det skulle vara en avsiktlig design att inte kunna ångra efter formatering låter lite märkligt, skulle det i så fall vara en medveten trade-off för att spara tid eller uppnå någon annan funktionalitet?

Har ni en länk till GitHub repository för editorn? Det kanske finns mer information att hämta i issues-listan där.

Det vore intressant att veta vilka anpassningar ni har gjort för tillgänglighet, är det ändringar i programkoden som är tillgängliga som öppen källkod? Det låter som något som kunde vara lämpligt att dela med andra institutioner som har samma krav på sig.

@salgo60-ej-aktiv sa i Govdirectory och statligt ägda bolag:

dvs,.

Akademiska Hus = Wikidata Q10403939

prop. 1991/92:44 = Wikidata Q98487906

bet. 1991/92:FiU8 tror samma som Wikidata Q98416584

rskr. 1991/92:107...

Läggs de posterna in i Wikidata med automatik?
Finns det kopplingar mellan dokumenten och bolaget?

Hur går man tillväga om man har en lista eller tabell med data som man vill lägga till eller uppdatera i Wikidata, annat än att lägga till varje post manuellt?

@salgo60-ej-aktiv Ja det verkar vara mycket tabeller från myndigheter som ligger inbäddade i PDF:er och det är problematiskt för den som vill göra något med informationen tycker jag. Jag undrar om det finns några planer för att förbättra den situationen, för många av de offentliga verksamheter jag har varit i kontakt med verkar i dagsläget helt ointresserade av att tillhandahålla informationen i något mer strukturerat format, med hänvisning till att det inte ingår i deras åtaganden.

Vad gör petscan, är det en tjänst för att läsa in information från PDF:er, eller sammanställer den listor från Wikipedia-artiklar?

@mattias Ok, tack för uppdateringen.

@ainali Det finns visst ett filter för myndighetslistan, Områden: "Bolag med statligt ägande", som ger 49 träffar. Kanske rentav går att hämta listan via ett API då?

https://www.regeringen.se/myndigheter-med-flera/#1234

@ainali sa i Engagemang, Fokus, Öppenhet, Respekt och Mod:

@jonor Vi har inte tagit med statligt ägda bolag i första svängen, men det finns definitivt med i planerna!

Vet du om det finns någon definitiv offentlig källa för vilka som finns just nu?

Nej, det har jag inte koll på, tyvärr.

På regeringen.se står att det finns 46 bolag och 2 verksamhetsstiftelser.
https://www.regeringen.se/regeringens-politik/bolag-med-statligt-agande/

Där finns också verksamhetsberättelse för 2020 med vad som ser ut att vara en lista över bolag på sida 45 i en PDF. Ohanterligt men officiellt kanske.

https://www.regeringen.se/rapporter/2021/06/verksamhetsberattelse-for-bolag-med-statligt-agande-2020/

https://www.regeringen.se/4a0189/contentassets/a34b2a25b7a646d4850b5f6f2ec9e818/verksamhetsberattelse-for-bolag-med-statligt-agande-2020-komplett.pdf#page=45

På Wikipedia finns en lista med 47 bolag, men den saknar källhänvisningar.

https://sv.wikipedia.org/wiki/Lista_över_statliga_företag_i_Sverige

Såg inte att public service-bolagen var med någonstans så jag inser att jag blandat ihop den biten, de ska väl vara fristående bolag och lyder under en förvaltningsstiftelse, styrelsen är ju dock tillsatt av regeringen och nominerad av riksdagen. En intressant fråga kanske hur direktiv om digitalisering och öppna data berör bolagen under denna förvaltningsstiftelse.

https://sv.wikipedia.org/wiki/Förvaltningsstiftelsen_för_SR,_SVT_och_UR

Styrelsen för Förvaltningsstiftelsen består (2015) av en politiskt oberoende ordförande och tolv ledamöter som nomineras av riksdagspartierna[3][6]:39 och utses av regeringen.[6]:39

https://www.forvaltningsstiftelsen.se/

Spännande.
En hel del WordPress-relaterat publicerat synes det.

@nina_ Låter bra att det finns tankar kring att öka transparensen, även om ni är upptagna med annat. Digital infrastruktur handlar väl mer om säker och intern kommunikation mellan myndigheter. Hur ser det ut med vägkartan för öppna roadmaps, är det något man kan få en uppfattning om när det kan introduceras?

@salgo60-ej-aktiv Intressant initiativ med govdirectory.org, men det verkar inte som statligt ägda bolag i Sverige som SVT och SR är med?

Hej, om jag markerar text och applicerar en formatering via knappraden så går det inte att ångra ändringar i editorn som gjordes innan formateringen.

Någon annan som märkt av det problemet? Jag är annars van att kunna ångra redigeringar med Ctrl-Z.

@mattias Tack, då kan man förstås fundera över varför DIGG inte verkar ha känt till den specifikationen.

Jag är osäker på om schemalänken fanns på sidan för datasetet förut, men den säger hur som helst ingenting om teckenkodning, separatortecken eller datatyper, det är som synes bara en lista över kolumnnamn.

https://lankadedata.se/spec/leverantorsreskontra/schema.json

Det är bra att det finns en manuell specifikation för leverantörsreskontra som beskriver fältvärden och sådant, men den svarar inte heller inte på de frågor jag ställde angående CSV-formatet. Hur ska jag veta som datakonsument hur jag ska avkoda filen?

I specifikationens punkt 3 om CSV-formatet står det:

För den här specifikationen innebär det att implementatörer rekommenderas även stödja semikolonseparerade filer.

För att särskilja data som är semikolonseparerade från kommaseparerade måste första raden se ut som:
kopare_id;kopare;verifikationsnummer;leverantor;leverantor_id;konto_nr;konto_text;belopp;datum;forvaltning;faktura_nr;grund;avtal;kommun_id,s_kod_nr

(Här har det dessutom smugit sig in en felskrivning där sista separatorn är ett kommatecken.)

Jag tycker det verkar märkligt. Är det jag som datakonsument som ska vara "implementatören" och stödja andra format än det standardiserade?

Det framgår inte tydligt hur jag ska lösa det från konsumentsidan.

Det står "för att särskilja data måste första raden se ut som ...", men ingen hänvisning till hur detta stöds eller implementeras i bibliotek eller programvaror. Ni verkar här uppmuntra dataleverantörer att lägga ut variationer som avviker från standardformatet och lämnar till konsumenten att tolka detta utifrån filinnehållet istället för att deklarera formatet i metadata.

Sedan blir det ju en motsägelse då man bryter mot specifikationen om man lägger ut en svenskspråkig Excel-export med semikolonavskiljare för fält och kommatecken för decimaltal?

Denna specifikation kräver dock att man använder punkt i decimaltal (se 2.1).

Antingen bör ni väl hålla er till standardiserad CSV enligt RFC eller deklarera i metadata all information om avvikelser som behövs för automatisk inläsning?

Så vitt jag kan se beskrivs det faktiskt i dokumentationen ni hänvisar till hur detta ska göras:

https://www.w3.org/TR/tabular-metadata/#dialect-descriptions

https://www.w3.org/TR/tabular-data-primer/#dialects

6.5 What about CSV that isn't standard CSV?
A lot of what's called "CSV" that's published on the web isn't actually CSV. It might use something other than commas (such as tabs or semi-colons) as separators between values, or might have multiple header lines.

The metadata that's described here can be used with files that contain tabular data but that aren't CSV. You can provide guidance to processors that are trying to parse those files through the dialect property on a table description.

EXAMPLE 126

{
  "@context": "http://www.w3.org/ns/csvw",
  "url": "http://example.org/data/unemployment.tsv",
  "dialect": {
    "delimiter": "\t",
    "headerRowCount": 3
  }
}

I datasetet på dataportalen så talar ni dock bara om att jag ska ignorera blanktecken runt fältvärden:

  "dialect": {"trim": true},

@nina_ sa i Engagemang, Fokus, Öppenhet, Respekt och Mod:

@jonor Vår tavla är intern och används bara av de anställda som deltar i våra projekt och uppdrag. Alla här på myndigheten kan inte se alla tavlor. Vi kan alltså inte öppna vår tavla externt.

Hej, tack för svar. Det jag undrade över var de huvudsakliga skälen till att tavlorna är privata. Vilken typ av känslig information är det ni inte kan dela mellan avdelningar på myndigheten eller med allmänheten? Är det ekonomisk information, personuppgifter, typ av funktionalitet eller annat som inte kan delas av sekretesskäl?

@nina_ sa i Engagemang, Fokus, Öppenhet, Respekt och Mod:

Vi har inte möjlighet att öppna vår interna ärendetavla för alla, men vi jobbar för att ha ett mer öppet arbetssätt.

Det skulle vara intressant att höra om vilka ni anser vara huvudskälen till att det inte går att öppna en ärendetavla. Är det beroende på typer av ärenden, eller personuppgifter som betraktas som känsliga t.ex. Vilka delar i ärendetavlan skulle eventuellt kunna publiceras för en allmänhet? Är detta något ni har analyserat aller funderat över?

@nina_ Jag tror en bidragande orsak till att tonen kan verka hård eller kritisk är att det skrivs så lite här från DIGG eller representanter från andra offentliga verksamheter. Många frågor som som riktar sig till offentliga verksamheters aktiviteter på området ignoreras och lämnas obesvarade vilket blir en källa till frustration för den som hoppas på information om eller inblick i den eventuella utvecklingen. Forumet kan förefalla ganska övergivet och mer som en bock i någon checklista, eller en annonstavla för interna verksamheter, än något allvarligt menat försök att kommunicera öppet. Jag är faktiskt förvånad över det låga intresset från DIGG själva som driver dataportalen att besvara eller engagera sig i diskussionerna här. Tycker ni att engagerade användare av datamängder och API:er bara ska diskutera sinsemellan här får ni nog räkna med att det klagas en del över att den ena sidans huvudaktörer i ekvationen lyser med sin frånvaro.

Om ni vill se ett bättre klimat här tror jag det är värt att satsa på ökad närvaro och att visa ett intresse i att diskutera och besvara synpunkter och återkoppling från intresserade användare.

Så länge det inte rör sig om personangrepp ska väl annars en offentlig institution kunna tåla ett visst mått av kritik från missnöjda medborgare, och utöver att endast klaga på tonläge eller ordval också försöka bemöta detta med en trovärdig argumentation och vilja att föra resonemang kring de tjänster man producerar.

Ni kan gärna försöka förtydliga syftet med det här forumet annars, vilka typer av frågor och svar som är lämpliga att dryftas här, jag har själv undrat om jag kanske har missuppfattat det.

@jonass sa i Här kommer höstens NOSAD- workshops!:

Kunskapsgrafer är bra och kan såklart tillämpas när det är lämpligt. Jag personligen tycker dock att CSV och enkla APi:er är underskattade. En gammal hederlig fil med bestående identifierare för informationsobjekten och ett känd metod för att hämta ytterligare information från andra API:er kommer man långt med.

Kunde vara intressant för övrigt att höra mer om vilka metoder för att hämta ytterligare information från andra API:er du tänker på, och hur de eventuellt liknar eller skiljer sig från kunskapsgrafer.

Community på Sveriges dataportal

jonor

Inlägg

Status