"Hij kwam bij een stroom. Omdat hij niet zeker was van de diepte, ging hij peilen; en toen hij ontdekte dat de diepte variabel was, berekende hij een gemiddelde. Omdat zijn zoon de gemiddelde diepte kon doorwaden, liet hij hem zonder aarzelen door de beek lopen, met het trieste gevolg dat de jongen verdronk…"
Een gemiddelde kan een nuttige maatstaf zijn als je de verandering over tijd binnen een bepaalde populatie of dataset wilt begrijpen, zoals huizenprijzen, consumentenvertrouwen of de schuldenlast van bedrijven. Het bovenstaande verhaal laat echter ̶ op nogal brute wijze ̶ zien dat een gemiddelde niet altijd de beste maatstaf is. Het toenemende gebruik van ESG-ratings lijkt erop te wijzen dat deze les niet voldoende wordt begrepen.
Dit komt onder andere door de Green Deal van de Europese Commissie, die erop gericht is de dreigingen van klimaatverandering en milieuschade aan te pakken. In november 2020 publiceerde de Europese Centrale Bank bovendien duidelijke richtlijnen over de manier waarop banken klimaat- en milieurisico’s moeten beheersen. Een laatste voorbeeld is de introductie van de Sustainable Finance Disclosure Regulation (SFDR), die banken en vermogensbeheerders verplicht om informatie te verstrekken over de wijze waarop duurzaamheidsrisico’s en potentiële ongunstige effecten op duurzaamheid zijn geïntegreerd in hun investeringsproces.
Bij het implementeren van deze nieuwe richtlijnen en regelgeving wordt regelmatig gebruik gemaakt van ESG-ratings. Deze beogen de prestaties van een bedrijf te meten met betrekking tot Environmental, Social en Governance-aspecten (ESG); vergelijkbaar met de wijze waarop een kredietbeoordeling de kans op een faillissement van een bedrijf meet. Het aantal indicatoren dat aan een ESG-rating ten grondslag ligt, is doorgaans echter hoog ten opzichte van het aantal indicatoren dat wordt gebruikt om creditratings te bepalen ̶ meer dan 100 indicatoren is geen uitzondering. Die variëren van milieu-indicatoren ̶ zoals uitstoot van broeikasgassen, waterverbruik en vervuiling door de onderneming ̶ tot sociale en governance-indicatoren, zoals het aantal arbeidsongevallen, de inzet van kinderarbeid en de aanwezigheid van anti-corruptiebeleid. Het is dan ook niet verrassend dat de wetenschappelijke literatuur aantoont dat de verschillen tussen de ESG-ratings van ratingaanbieders aanzienlijk zijn.
In de praktijk is een ESG-rating vaak het (gewogen) gemiddelde van alle individuele indicatoren. Dit geeft mogelijk niet de beste inschatting van de 'diepte van de rivier'. Zo kan Tesla Inc. als voorloper op het gebied van elektrische voertuigen vrij goed scoren op bepaalde milieuaspecten, terwijl het vanuit sociaal en governance- oogpunt niet als beste in zijn klasse wordt beschouwd. Het gemiddelde van de scores over de E-, S- en G-pijlers leidt dus niet tot een volledig beeld van de duurzaamheid van dat bedrijf. Of bekijk het zo: is kinderarbeid (negatieve score) een minder groot probleem als de werknemers van datzelfde bedrijf zich mogen aansluiten bij een vakbond (positieve score)?
Het probleem doet zich ook voor binnen de drie ESG-pijlers, aangezien ook binnen een pijler meestal een breed scala aan indicatoren wordt gebruikt om de prestaties van een bedrijf te beoordelen. Een in Koeweit gevestigd olieboorbedrijf zal bijvoorbeeld niet zo goed scoren op de uitstoot van broeikasgassen, maar kan mogelijk wel een goede score behalen voor ontbossing (om de simpele reden dat er in de woestijn al weinig bos te vinden is). Het simpelweg middelen van alle milieu-gerelateerde indicatoren leidt daardoor niet tot een zinvol beeld van de milieuprestaties van het bedrijf, noch zal het helpen om te begrijpen aan welke klimaatrisico’s het bedrijf is blootgesteld.
Om de duurzaamheid van een bedrijf echt te doorgronden, is het belangrijk om alle (materiële) indicatoren individueel te beoordelen. Alleen op die manier is het mogelijk om de veelzijdigheid van ESG recht te doen. Degenen die alleen de overkoepelende ESG-rating gebruiken, riskeren een verdrinkingsdood.