Välkomna till Omvärld.se, Fas 4
Projektet Omvärld.se använder interaktiva visualiseringar för att svara på frågor som annars döljer sig djupt nere i statistik och stora datamängder.
Tekniken är egentligen inte ny. Med program som Excel och Google kalkylark har man under ganska lång tid kunnat visualisera data på relativt enkla sätt. I takt med att möjligheterna att samla data ökar via sensorer och söktjänster, finns också ett ökat behov av att presentera dessa på ett överskådligt sätt.
Målet är att producera material som både kan användas i skola, för ökad delaktighet och medborgardemokrati, och som underlag för politikers beslutsfattande.
De tre tidigare faserna har riktat in sig på olika fokusområden. Den första fasen fokuserade vi på hur Gapminder kan användas i undervisningen i ett samarbete med Hans Rosling. Den andra fasen genomfördes i ett samarbete med lärare på Katedralskolan i Växjö. Båda dessa projekt finansierades av Internetfonden. Den tredje fasen hade migration som huvudtema och finansierades av Region Kronoberg.
Bopriser, del 1
2017-05-11 Första steget i att titta på utvecklingen av bopriser i landets kommuner. Välj ett antal kommuner i listan och klicka så ritas de ut.
Jag tror att man luras en del av att utgångsvärdet för en del kommuner är så mycket större. Kanske är prisökningen i själva verket mycket högre i en del av de kommuner som började med väldigt billiga bostäder?
Vad gäller tekniken bakom inlägget så är det vue.js och Plot.ly. Ganska svårt att få det att funka, men intressanta tekniker för visuella och reaktiva webbsidor.
/Simon
Fourier, transformationer
2017-04-03
När jag gick naturvetenskaplig linje på gymnasiet var det några matematiska begrepp man inte läste om, men som var nästan mytomspunna. Superkomplexa och kraftfulla. Ett av dem var Fourier-transformationer.
Matematiken har en historia av att stänga ute de som inte kommit till ämnet från rätt håll, de som inte förstått varje underliggande steg. Ofta undrar jag om det är rätt sätt att bedriva pedagogik, och jag tror att det delvis har luckrats upp idag.
Bret Victor är en av dem som mest vältaligt har kritiserat matematiken från ett programmeringstekniskt perspektiv, och han har visat hur man kan förklara en del matematiska samband genom att visualisera dem med kod snarare än att bevisa dem med abstrakta symboler. Så här skrev han 2011 i sitt manifest "Kill Math":
Kill Math is my umbrella project for techniques that enable people to model and solve meaningful problems of quantity using concrete representations and intuition-guided exploration. In the long term, I hope to develop a widely-usable, insight-generating alternative to symbolic math.
Syftet med det här inlägget är att visa några visualiseringar i Victors anda. Mitt intresse för Fourier-transformationer återuppväcktes den här gången av en hund, ritad som ett enda streck, av en klurig maskin:
På sidan kan man också förenkla maskinen som ritar hunden, ner till bara en cirkel. Någon beskrev bilden och nämnde Fourier-transformationer och det visar sig att det finns fler sådana bilder, bland annat en som refererar till Ptolemaios teori för planetbanor och epicykler (Wikipedia), där den komplicerade planetbanan i det här fallet får formen av... Homer Simpson!
När man först stöter på Fourier-transformation så är det ofta för att förklara hur man kan beskriva en komplex ljudsignal som summan av en mängd sinusvågor. För att förstå relationen mellan cirklarna som genererar hunden och sinusvågor så är det ett par steg, inte bara matematiskt utan även konceptuellt/visuellt. Här är en enkel och interaktiv visualisering i Geogebra av en cirkel och en enkel sinusvåg.
Men sen är det dags för att lägga ihop sinusvågor och se vad resultatet blir. Här är en sida som är alldeles för komplicerad, men som en bit ner har sådana här där man kan ändra värden och se hur summan av vågorna läggs ihop till komplexa mönster.
Här är en video som först inte är så förtroendeingivande, med dramatisk röst och rysk musik, men de första 10 minuterna är riktigt bra. Man får en bra förståelse för hur kurvor och cirkelrörelser hänger ihop:
I skärmdumpen här så är det den blå och röda kulan till höger som genererar kurvan, när tiden går från vänster till höger. Och på vänster "vägg" ser man skuggan av det som skulle motsvaras av "hunden" i det första exemplet.
Här är ännu ett exempel, där man kan se hur de två representationerna hänger ihop, och även se koden bakom. Exemplet är begränsat till fyrkants- och sågtandsvåg, men man kan ändra "order" för att göra generatorn mer eller mindre komplex. (Så "order" ska inte tolkas i betydelsen "sortering" utan i betydelsen "simulering av en högre ordning".)
See the Pen Fourier series by Infontology (@infontology) on CodePen.
https://production-assets.codepen.io/assets/embed/ei.js
(Det är inte jag som har skrivit koden. Den är upplagd anonymt, och jag behövde "forka" den för att kunna bädda in den här i sidan.)
Det får räcka för den här gången. Jag tror att de här exemplen kan ge en första förståelse för hur sinusvågor kan läggas ihop till mer komplexa vågor.
Jag har fortfarande inte förstått om det är programmet som från början ritade hunden, eller om det finns ett sätt att gå från en befintlig teckning till en summa av sinus-vågor, men jag tror det. Jag kan ändå inte tänka mig att de som gjorde Simpsons-videon satt och prövade sig fram...
/Simon
In- och utflyttningar
2017-03-20 Det här diagrammet baseras på data om in- och utflyttningar till Kronobergs län. Det tar bara med de kommuner som har störst totalantal flyttningar till/från den aktuella kommunen. (Väljer man ett stort antal kommuner funkar inte diagrammet tillfredsställande.)
/Simon
Försörjningskvot, del 2
2017-01-12 I den första delen introducerade jag begreppet försörjningskvot och hur det visas på en karta. Nu tänkte jag skriva lite mer om färgerna i kartan.
Bakom de flesta statistiska mätningar ligger ett ideal, antingen ett synligt eller ett osynligt. Bakom begreppet försörjningskvot ligger idealet att "lägre = bättre", för då är försörjningsbördan lägre på de som är i arbetsför ålder.
(Man kunde tänka sig att högre var bättre för det blir ett trevligare samhälle med många barn och gamla. De gamla skapar liv i staden på dagarna, och kan ta hand om barnen på eftermiddagarna, exempelvis. Men försörjningskvot är ett ekonomiskt begrepp, skapat för att mäta ekonomisk belastning.)
I stället för en färggradient kan jag dela in kartan i "buckets", där jag får en distinkt färg för varje intervall i mina data. Gör jag det automatiskt med 5 "hinkar" blir det så här:
Problemet är fortfarande att det är en väldigt mörk karta. När jag tittar på mina data beror det på att jag har ett enda felaktigt värde i min tabell – en kommun har värdet noll, och det gör att skalan förskjuts helt. De andra värdena ligger mellan ungefär 50 och 100!
Om jag ska göra möjligheterna till tendentiös representation så tydliga som möjligt blir det kanske så här, en karta med riktigt höga värden som röda eller orange, och de riktigt bra som klargröna eller blekgröna öar. Bara man är medveten om att den här kartan är väldigt vinklad så tycker jag den "säger" väldigt mycket!
Den här kartan visar både stråk och öar. Det hade varit intressant att hitta en representation för att kombinera den här kartan som ju bara bygger på åldersfördelning med en karta som visar befolkningstäthet, arbetslöshet och medelinkomst.
Del 1. Fortsättning i del 3.
/Simon Winter
Försörjningskvot, del 4
2017-01-12 Som en del av den här fasen är det meningen att vi ska pröva lite mer avancerad teknik. En sak som vi vill göra är att visa flera olika kartor på samma ställe på sidan och växla mellan dem
/Simon Winter
Bopriser, del 2
2017-05-17 Om man vill lära känna olika faktorer som gör en region mer eller mindre attraktiv så tror jag att bostadspriserna är centrala som indikator.
I det förra inlägget såg vi på bopriserna i absoluta tal. Då är det lätt att se skillnader i faktiska kostnader, men inte så lätt att se om någon ort drar ifrån övriga orter. I det här diagrammet ser vi förändringen i stället.
För att förändringen ska se realistisk ut visas den med en logaritmisk skala. Den gör att en jämn förändringstakt visas med ett rakt streck. Annars ser det ut som att vissa orter "drar ifrån" utan att de egentligen förändras mer än de andra. Se det här inlägget för en förklaring.
Tack till Marie för hjälpen. /Simon
Datatvätt
2017-03-27 Rätt mycket av tiden för visualiseringar går åt att se till att data är i rätt format.
I Fusion tables behöver man matcha kolumners data när man slår ihop två tabeller till en fusionerad tabell.
Kommunnamn kan förstås matchas på själva namnet, men då finns det alltid en risk att svenska tecken (å, ä, ö) tolkas olika. Därför brukar jag utgå från kommunkoden, om det finns en sådan.
I det senaste materialet har kommunkoden dock slagits ihop med kommunnamnet, så att det i ett fält står exempelvis "0780 Växjö". I tabellen som innehåller de geografiska kommungränserna står det bara "0780".
Man kan inte på ett lätt sätt göra "sök och ersätt" i Excel, så att man tar bort vissa tecken, utan det lättaste är att göra en ny kolumn, och använda en formel för att fylla den nya kolumnen.
Så här blir det, med formeln som heter "VÄNSTER" i svenska Excel.
I Google spreadsheets heter motsvarande Left (och det antar jag den gör i engelska Excel).
Man får se upp lite sen när man ska exportera/kopiera kolumnen med kommunkoderna, eftersom det i princip är en formel och inte ett värde som står där. Är man osäker kan man göra ytterligare en kolumn och göra "Klistra in special" och klistra in enbart värden. Googles Fusion tables klarar dock av att konvertera kolumner med formler till värden.
/Simon
Försörjningskvot, del 1
2017-01-12 Den här fasen ska handla bland annat om folkomflyttningar. Vi ska titta på olika faktorer som skiljer kommuner och regioner åt, och som kan få folk att flytta, eller som bara indikerar vissa fördelningar, mellan resurser eller människor.
Den första indikatorn är "försörjningskvot". Namnet är lite lömskt, för det rör sig om ett helt demografiskt begrepp, som egentligen inte har med faktisk försörjning att göra. Försörjningskvot betecknar antalet personer under 20 eller över 65 delat med antalet personer mellan 20 och 64.
Det antas att den som är mellan 20 och 64 ska försörja de övriga, och kvoten blir en indikation på hur många en viss person förväntas försörja, utöver sig själv. En försörjningskvot på 70 betyder att en person ska försörja 0,7 andra också.
(Försörjningskvot verkar alltid anges så här i procent, snarare än som en verklig kvot. Det finns kritik mot begreppet försörjningskvot för att det inte tar upp hur många som faktiskt arbetar, utan bara inriktar sig på hur många som är i en viss åldersgrupp.)
En låg försörjningskvot betyder att "bördan" på de som förväntas arbeta är låg.
SCB har data för försörjningskvot, för åren 2006-2014. Jag har jobbat med åren 2000 och 2015 som regionen har försett mig med.
Ambitionen för den här fasen är att kunna göra visualiseringar med lite bredare användningsområde än bara i skolan, och att pröva lite nya tekniker. Bland annat skulle det vara intressant att kunna göra kartor på ett lite mer automatiserat sätt. Det visade sig dock vara svårare än jag trodde.
En enkel karta går lätt att få fram om man lägger sina data i en Fusion table, och lägger till en tabell med kommungränserna, som det beskrivs i den här teknikgenomgången.
Här är tabellen, och så här ser en karta ut:
Den är interaktiv och fin, och om man klickar på en kommun får man upp alla data för den kommunen.
Det går att se skillnader i nyanserna på kartan, men hela kartan är ganska mörk. Och här började egentligen svårigheterna för mig: hur ska man välja vilka färger som visas? Hur gör man skillnaderna tydliga, utan att överdriva?
Det är ofta diskussioner om diagram där y-axeln inte börjar på noll, och där man därför överdriver de skillnader som visas i diagrammet. Här är ett exempel:
Det som i diagrammet ser ut som en fördubbling på två år är i själva verket en ökning från 55 till 65 %...
Samma problematik finns i kartorna, fast kanske ännu mer lömsk. Hur ska man sätta färgerna? Och om ambitionen är att skapa kartor automatiskt från data – hur ska man utifrån datamängden kunna sätta en färgskala??
Fortsättning i del 2.
/Simon Winter
Försörjningskvot, del 3
2017-01-12 I det första inlägget introducerade jag begreppet försörjningskvot, och i det andra fokuserade jag på hur man väljer skalor och färger för kartorna. Nu tänker jag skriva om förändringar i försörjningskvot.
De data jag fått täcker 2000 och 2015, tillräckligt lång tid för att kunna se förändringar i befolkningsstrukturen. Om jag behåller min övertydliga trafikljuskarta och jämför 2000 och 2015 blir det så här:
Och för att göra det tydligt var förändringen har skett går det lätt att dividera data för 2015 med data för 2000.
Här är färgningen gjord så att de grå kommunerna är i stort sett oförändrade, de blekgröna lite "bättre" och de klargröna mycket bättre. De gula lite förändrade åt det negativa, de orange och de röda mycket förändrade i riktning mot en större försörjningskvot, alltså att varje människa i yrkesarbetande ålder måste försörja fler som inte är i arbetsför ålder.
Del 1, 2. Fortsättning i del 4.
/Simon Winter
Du måste vara inloggad för att kunna skicka en kommentar.