Osakesijoittamisen suosio Suomessa on kasvanut merkittävästi. Vuoden 2020 alusta lähtien on avattu yli 340 000 osakesäästötiliä, mikä on helpottanut osakekauppojen tekemistä ja siirtänyt verotuksen varojen nostohetkeen. Kehitys on houkutellut erityisesti nuoria aikuisia sijoittajiksi. Heistä kaksi kolmasosaa on alle 40-vuotiaita. Sijoituskohteen valinta ja sijoituksen määrä ovat aina haasteellisia päätöksiä sijoittajalle. Historiallista aineistoa hyödyntävät koneoppimisalgoritmit auttavat arvioimaan sijoituskohteen riskejä ja tuotto-odotuksia ja näin helpottavat päätöksentekoa.

Osakesijoittamisen suosio on kasvanut ja erityisesti nuoret aikuiset ovat entistä kiinnostuneempia sijoittamisesta [1]. Kuitenkin suuri osa (65 %) suomalaisten varallisuudesta on edelleen matalakorkoisilla tileillä. Suomen Pankin mukaan suurin osa kotitalouksien talletuksista on yön yli talletustileillä, joille on talletettu 70,6 miljardia euroa. Vuoden 2023 lopussa kotitalouksien talletuskannan keskikorko oli vain 1,18 prosenttia. Vuoden aikana kotitaloudet siirsivät 7,3 miljardia euroa määräaikaistileille ja hieman yli 2 miljardia euroa sijoitustalletustileille, mutta yön yli talletukset ovat edelleen suurin yksittäinen kohde. [2] Huomionarvoista on, että yön yli talletuksiin sisältyvät myös käyttötilien varat, jotka on pääsiassa varattu kotitalouksissa päivittäiseen elämiseen, ei sijoittamiseen.

Koneoppiminen osakemarkkinoiden analyysissa

Pörssisäätiön mukaan osakkeiden keskimääräinen vuosituotto pitkällä aikavälillä on noin 8 prosenttia, mikä on huomattavasti korkeampi kuin kotitalouksien talletuskannan tarjoama keskimääräinen korko [3]. Tämä korostaa osakkeiden potentiaalia parempana sijoituskohteena verrattuna varojen pitämiseen matalakorkoisilla tileillä.

Nykyaikaiset data-analytiikan menetelmät tarjoavat paljon eri mahdollisuuksia osakemarkkinoiden analysointiin. Tämä blogiteksti perustuu opinnäytetyöhön, jossa analysoitiin Suomen osakemarkkinoita hyödyntämällä ohjaamattoman oppimisen klusterointitekniikoita. Tavoitteena oli selvittää, miten koneoppimista ja klusterointia on mahdollista hyödyntää osakevalinnoissa ja onko klusterointituloksista mahdollista tehdä tuottavia sijoituspäätöksiä lyhyellä sijoitushorisontilla. (Kuva 1.)

Valokuva, jossa tietokoneen näyttö, jolla osakekursseja.
KUVA 1. Koneoppiminen voi tarjota uusia näkökulmia ja mahdollisuuksia sijoittajalle (kuva: Nicholas Cappello/unsplash.com).

Kolme menetelmää ja seitsemän tunnuslukua

Opinnäytetyössä vertailtiin kolmea eri klusterointimenetelmää ja niiden soveltuvuutta sekä suorituskykyä pörssiosakkeiden klusteroinnissa. Työhön valitut menetelmät olivat K-Means, hierarkkinen klusterointi ja Gaussian Mixture Model. K-Means ja Gaussian Mixture Model ovat menetelmiä, joissa klusterien määrä valitaan etukäteen ja algoritmi jakaa aineiston näihin klustereihin. K-Means on näistä yksinkertaisempi, käytännössä yksinkertaistus Gaussian Mixture Model -klusteroinnista. Hierarkisessa klusteroinnissa klusterien määrää ei oleteta, vaan malli tuottaa dendogrammin, jonka perusteella käyttäjä voi määritellä optimaalisen klusterien määrän. Hierarkinen klusterointi vaati melko paljon laskentatehoa, eikä siksi soveltuisi kovin hyvin suurille aineistoille.

Menetelmiä sovellettaessa datana käytettiin suomalaisten pörssiyritysten taloudellisia tunnuslukuja, joita olivat oman pääoman tuotto, hinnan ja tuloksen suhde, tasekerroin, velkaantumisaste, osinkotuotto, tulostuotto sekä osakekohtainen tulos. Analyysissä käytettiin vuoden 2022 viimeisen kaupankäyntipäivän tietoja. Tavoitteena oli tunnistaa, miten eri klusterointitekniikat ryhmittelevät yrityksiä niiden taloudellisen profiilin perusteella. Lisäksi tavoitteena oli selvittää, mikä tekniikka tarjoaa parhaat mahdollisuudet osakkeiden valintaan sijoituspäätöksiä varten.

Hierarkkinen klusterointi loistaa pisteiden valossa, mutta riski ja tuotto kulkevat käsi kädessä

Tutkimuksen tulokset osoittivat, että valittujen pisteytysten valossa hierarkkinen klusterointi suoriutui tekniikoista parhaiten. Paremmuutta arvioitiin käyttämällä sisäisiä arviointimenetelmiä, kuten Silhouette-pisteytystä, Davies-Bouldin indeksiä sekä Dunn-indeksiä. Näitä menetelmiä käytetään mittaamaan klustereiden tiiviyttä ja erottuvuutta.

Hierarkkisen klusteroinnin avulla tunnistettu parhaiten suoriutunut klusteri osoitti keskimääräisen vuotuisen osakekurssin kasvun olevan 36,76 prosenttia. On kuitenkin tärkeää huomata, että klusteri sisälsi myös osakkeita, joiden kurssikehitys oli negatiivinen. Tämä tarkoittaa sitä, että vaikka keskimääräinen tuotto oli korkea, klusterin sisällä oli merkittävää vaihtelua osakkeiden suorituskyvyssä.

Tarkempi arviointi paljasti lisäksi, että klusterin taloudelliset tunnusluvut olivat erittäin riskipitoisia ja edustivat ääripäätä verrattuna opinnäytetyössä esiteltyihin suositeltuihin arvoihin. Sijoittaminen tämän klusterin perusteella vaatisi huomattavaa riskinsietokykyä. Tällaiset sijoitukset edellyttävät tarkkaa harkintaa, sillä mahdolliset tuotot tulevat huomattavien riskien kustannuksella. (Kuva 2.)

Valokuva, jossa kaksi tietokoneen näyttöä, joilla osakekursseja.
KUVA 2. Kiinnostus osakekauppaa kohtaan on kasvanut tasaisesti. Markkinoiden tuntemus vaatii perehtymistä. (Kuva: Sergei Tokmakov/pixabay.com).

Klusterointi on potentiaalinen sijoittajan työkalu, mutta vaatii vielä jatkokehitystä

Hierarkkinen klusterointi osoittautui tässä tarkastelussa parhaaksi osakkeiden ryhmittelyssä niiden taloudellisten ominaisuuksien perusteella. Tämä voi auttaa sijoittajia tekemään perusteltuja päätöksiä ja parantamaan riskienhallintaa. Vaikka parhaimman klusterin keskimääräinen tuotto oli korkea, se sisälsi myös osakkeita, joiden kurssikehitys oli negatiivinen. Tämä korostaa yksittäisten sijoitusten riskien arvioinnin tärkeyttä.

Lähestymistapa voi auttaa sijoittajia tunnistamaan paitsi potentiaalisesti korkean tuoton osakkeet myös markkinasegmentit, jotka saattavat tarjota tuottavia sijoituksia lyhyellä 12 kuukauden aikavälillä. Sijoittajien on kuitenkin kyettävä analysoimaan sekä ymmärtämään yksityiskohtaisesti ryhmittelytuloksia ja ymmärtämään markkinoiden dynamiikkaa sekä pitkän aikavälin trendejä parantaakseen tuotto-odotuksiaan ja vähentääkseen riskejä.

Opinnäytetyön tulokset tarjoavat sijoittajille vaihtoehtoisen työkalun sekä menetelmän osakevalintaan ja sijoitusstrategioiden kehittämiseen. Lähestymistavan tehokas hyödyntäminen vaatii kuitenkin syvällistä osaamista taloudellisten tunnuslukujen tulkitsemisessa, laajaa markkinatuntemusta sekä koneoppimisen tekniikoiden ymmärrystä. Keskivertosijoittaja tuskin vaivautuu käyttämään tällaista työkalua, sillä se vaatii huomattavaa perehtyneisyyttä ja analysointikykyä.

Lisäksi valmiista tuotteesta puuttuu vielä monia ominaisuuksia, jotta se voisi kertoa sijoittajalle yksityiskohtaisesti ja selkeästi ryhmittelyn tulokset ja antaa esimerkiksi suosituksia. Tulokset ovat kuitenkin kiinnostavia koneoppimiseen perustuvien sijoitustyökalujen kehityksen kannalta ja tarjoavat merkittäviä mahdollisuuksia jatkokehitykselle.


Timo Rautio
Opiskelee tradenomiksi (ylempi AMK) Oulun ammattikorkeakoulussa data-analytiikan ja projektijohtamisen tutkinto-ohjelmassa

Ilpo Virtanen
yliopettaja
ICT ja liiketoiminta
Oulu ammattikorkeakoulu

Blogiteksti perustuu opinnäytetyöhön:

Rautio, T. (2024). Comparative analysis of clustering techniques for stock selection in finnish stock markets using common financial metrics [YAMK-opinnäytetyö, Oulun ammattikorkeakoulu, Data Analytics and Project Management]. Theseus. https://urn.fi/URN:NBN:fi:amk-2024060219855

Lähteet

[1] Erkkilä J. (22.12.2023). Osakesijoittajia pian yli miljoona – kriisi toi suomalaisia pörssiin. SalkunRakentaja. https://www.salkunrakentaja.fi/2023/12/osakesijoittajat-suomi-miljoona/

[2] Suomen Pankki. (8.2.2024). Korkeakorkoisten talletusten suosio on kasvanut [tiedote]. https://www.suomenpankki.fi/fi/tilastot2/tilastotiedotteet_fi/historia/2023/korkeampikorkoisten-talletusten-suosio-on-kasvanut/

[3] Pörssisäätiö. (2024). Sijoituskohteet ja niiden valinta. Teoksessa Opi sijoittamaan. https://www.porssisaatio.fi/opi-sijoittamaan/sijoituskoulu/sijoituskohteet-ja-niiden-valinta/