HTML, PDF och JR1

Alltsedan COUNTER Release 2 blev obligatorisk 2006 har Journal Report 1 (JR1) redovisat tre värden för Number of successful full-text article requests by month and journal:

  • Total
  • HTML
  • PDF

Av dessa är totalanvändningen, som utgörs av summan av HTML-visningar och nedladdade PDF-filer, ett vanligt siffervärde för jämförelser av tidskriftsanvändning. Genom att använda mätetalet kommer dock dess inbyggda svagheter att påverka bedömningen av plattformar, tidskrifter och deras kostnader. Utan att ta hänsyn till dessa förutsättningar, riskerar bedömningarna att utgå från delvis missvisande data.

I det här blogginlägget kommer jag att försöka presentera konsekvenser av att basera bedömningar på antingen totalanvändning eller på något av de två mätetal som den är summan av. Den statistik jag använder mig av är hämtad från de 14 plattformar som ger tillgång till drygt 90% av de e-tidskrifter som det bibliotek där jag arbetar abonnerar på.

Även om siffrorna och de slutsatser som jag drar av dem endast avser ett av Sveriges högskolebibliotek, bör de ändå kunna beskriva en situation som i grunden är relativt likartad på de flesta akademiska bibliotek.

JR1 Total

Under många år har JR1 Total uppvisat en god användning som fortsätter att öka år efter år med endast en relativt blygsam förändring av kostnaden per använd tidskriftsartikel. Abonnemangskostnaden för tidskriftspaketen har däremot ökat rejält under samma tidsperiod. Allt högre användning av tidskriftspaket som vart och ett innehåller allt fler tidskrifter brukar vanligtvis anges som förklaring till att utvecklingen av paketpriser och kostnaden per användning skiljer sig åt.

Under 2016 ökade totalanvändningen av tidskrifterna på de 14 plattformarna med hela 17,2%. Snittkostnaden per användning var 11,63 kr, en ökning med 3,8% från 2015 (11,20 kr). Av de drygt 25.000 tidskrifterna hade ca 65% använts under året.

JR1 Total består av JR1 HTML och JR1 PDF och är därför lika med summan av de två senare. För en av plattformarna, SpringerLink, är dock totalsumman större än summan av HTML och PDF. Anledningen till detta är att Springer har en funktionalitet som kallas Look Inside, vilken gör det möjligt för användare att ta fram enstaka bilder av PDF-sidor för att få en överblick av innehållet i en publikation. Funktionen introducerades ursprungligen för e-böcker, men är även tillgänglig för e-tidskrifter. Eftersom Look Inside vare sig kan räknas som HTML eller PDF, har COUNTER beslutat att sådan användning endast skall inkluderas i värdet för JR1 Total, därav det högre värdet för totalsumman.

Look Inside utgjorde drygt 10% av JR1 Total för plattformen SpringerLink under 2016 (värdet har varierat under åren och uppvisar en nedåtgående trend). Att tidskriftsanvändningen på SpringerLink endast utgör knappt 5% av den totala tidskriftsanvändningen på de 14 plattformarna gör att värdet för Look Inside knappast är av betydelse för det samlade resultatet.

JR1 HTML

Om det är möjligt att bortse från effekten av Look Inside på en av plattformarna, är det dock inte möjligt att bortse från att HTML-visningar är en del av den totala användningen. Under 2016 utgjorde HTML sammanlagt ca 41% av JR1 Total. För tre plattformar utgjorde HTML mindre än 10% av totalanvändningen, övriga plattformar befann sig inom intervallet 20-65%.

När COUNTER JR1 kompletterades med HTML och PDF var det bland annat för att möjliggöra bedömningar av den så kallade plattformseffekten, dvs. den dubbelräkning som sker då en användare först kommer till en plattform med fulltext på en webbsida (HTML) och endast därefter kan ladda ned fulltexten i PDF. Eftersom i stort sett alla användare laddar ned PDF-filer för läsning, räknas en sådan användning därmed två gånger (HTML + PDF). Med enbart en totalsumma blir användningsstatistiken på många plattformar på så sätt uppblåst utan att avspegla regelrätt användning, samtidigt som det inte går att jämföra användningen på sådana plattformar med användningen på plattformar där användaren först kommer till en sida med en sammanfattning av artikeln och först därefter får välja mellan fulltext i HTML eller PDF.

Det är dock värt att lägga märke till att det på några plattformar finns korta artiklar och vissa publikationstyper (tidningar och icke-vetenskapliga tidskrifter) som endast är tillgängliga som HTML-sidor. Användningen av dessa artiklar mäts då endast som HTML. Vanligast är dock att en HTML-sida är ett mellansteg på vägen till en PDF-fil. Ju högre andel HTML, desto större sannolikhet att det senare gäller.

Förutom plattformsutformning kan även länkning leda till höga värden för HTML-visningar. Om länkservrar och discoverysystem länkar direkt till en PDF-fil eller till en fulltextsida i HTML kan ha stor påverkan på användningsstatistiken.

JR1 HTML är ett problematiskt värde vars betydelse och användbarhet varierar mellan olika plattformar. För åtskilliga plattformar innebär HTML endast en dubbelräkning som gör värdet tveksamt och som när det ärvs vidare till JR1 Total ger upphov till en överskattning av användningen.

På grund av de stora variationerna mellan plattformarna förefaller det lämpligt att vara försiktig i bedömningar som baseras på siffervärden som inkluderar HTML-visningar.

JR1 PDF

För flertalet användare är det PDF-filer för nedladdning och utskrift som är anledningen till besöken på tidskriftsportaler. PDF-filer utgjorde under 2016 också den största andelen av JR1 Total. Sammanlagt utgjorde PDF-nedladdningar 59% av JR1 Total, med en plattformsvariation från 34% till 95%.

Även om antalet nedladdade PDF-filer ökade med 9,8% mellan 2015 och 2016, ökade HTML-visningarna däremot betydligt mer, med hela 31,2%. På grund av den ökande andelen HTML, har andelen PDF sjunkit mellan 2015 och 2016. Under 2015 dominerade PDF-nedladdningar på 11 av de 14 plattformarna, under 2016 på 8 av de 14 plattformarna.

Effekten av detta blir tydlig om man ser till kostnaderna per nedladdning. Priset per PDF-nedladdning var under 2016, 17,46 kr, en ökning med nästan 7% jämfört med 2015 (16,36 kr). Fortsätter utvecklingen som den hittills gjort kan därför snittkostnaden inom några år ha närmat sig 20 kr per nedladdad artikel.

Om bedömningen av användningsstatistiken baseras på JR1 PDF blir bilden inte lika positiv som om den baseras på JR1 Total. Med enbart PDF sjunker den samlade användningsstatistiken för tidskrifter till under 60% av totalsumman, andelen tidskrifter som använts krymper till 55% och kostnaden ökar med 50% per använd artikel. Trots det är JR1 PDF ett mer användbart och belysande mätetal än JR1 Total, vars högre användningssiffror på åtskilliga plattformar till stor del består av HTML-visningar som kan betraktas som dubbelt räknad användning.

Avslutande kommentar

För att få en realistisk uppfattning om tidskriftsanvändningen är det för de flesta plattformar mest rättvisande att använda mätetalen för PDF-nedladdningar. För ett mindre antal plattformar med hög HTML-användning beroende på avsaknad av fulltext i PDF-format kan det även vara lämpligt att komplettera med JR1 Total. Att däremot enbart studera totalsiffrorna är dock en metod som ger ett mindre användbart resultat på grund av sammanblandningen av plattformsrelaterade och användningsrelaterade siffervärden.