class: center, middle, title-slide .title[ # Economania blog - számokban ] .subtitle[ ##
EHTT - Szakmai est ] .author[ ### Granát Marcell ] .institute[ ### Magyar Nemzeti Bank & .blue[Neumann János Egyetem] ] .date[ ### 2022 ] --- <style type="text/css"> .red { color: red; } .blue { color: #378C95; } strong { color: red; } a { color: #378C95; font-weight: bold; } .remark-inline-code { font-weight: 900; background-color: #a7d5e7; } .caption { color: #378C95; font-style: italic; text-align: center; } .content-box { box-sizing: content-box; background-color: #378C95; /* Total width: 160px + (2 * 20px) + (2 * 8px) = 216px Total height: 80px + (2 * 20px) + (2 * 8px) = 136px Content box width: 160px Content box height: 80px */ } .content-box-green { background-color: #d9edc2; } .content-box-red { background-color: #f9dbdb; } .fullprice { text-decoration: line-through; } </style> ## A blog leggyakoribb kifejezései <img src="index_files/figure-html/unnamed-chunk-7-1.png" width="700px" height="450px" style="display: block; margin: auto;" /> --- # A blogon megjelent cikkek számának alakulása <img src="index_files/figure-html/unnamed-chunk-8-1.png" width="700px" height="450px" style="display: block; margin: auto;" /> --- # A blogon megjelent cikkek számának alakulása <img src="index_files/figure-html/unnamed-chunk-9-1.png" width="700px" height="450px" style="display: block; margin: auto;" /> --- class: middle, center # TF-IDF TF: hányszor fordul elő a kifejezés az adott dokumentumban `$$\text{IDF}=\ln \left(\frac{n_{\text {dokumentumok }}}{n_{\text {dokumentumok, amelyek tartalmazzák }}}\right)$$` `$$\text{TF-IDF} = \text{TF} \times \text{IDF}$$` -- .content-box-green[ Ez a módszer olyan szavakat fog azonosítani, amely az adott dokumentumban gyakran szerepel, de nem szerepel máshol. ] --- # TF-IDF évenként <img src="index_files/figure-html/unnamed-chunk-13-1.png" width="700px" height="450px" style="display: block; margin: auto;" /> --- # Legtöbbet publikált szerzőink | Szerző | # cikk | % | |:-----------------:|:------:|:------:| | Kolozsi Pál Péter | 49 | 13.24% | | Vonnák Balázs | 48 | 12.97% | | Neszveda Gábor | 41 | 11.08% | | Baranyai Eszter | 37 | 10.00% | | Tapaszti Attila | 30 | 8.11% | | Sebestyén Géza | 29 | 7.84% | | Lehmann Kristóf | 19 | 5.14% | | Banai Ádám | 18 | 4.86% | | Világi Balázs | 18 | 4.86% | | ... | ... | ... | --- # Leggyakoribb szavak szerzőnként <img src="index_files/figure-html/unnamed-chunk-15-1.png" width="730px" height="500px" style="display: block; margin: auto;" /> --- # TF-IDF szerzőnként <img src="index_files/figure-html/unnamed-chunk-16-1.png" width="730px" height="500px" style="display: block; margin: auto;" /> --- # Akiknek ez tetszett, szintén megnézték... <p><cite>Granát, M. P. and Z. M. Szabó (2021). <em>An analysis of customer reviews of the Airbnb Online Platform</em>. URL: <a href="https://marcellgranat.github.io/airbnb-research/">https://marcellgranat.github.io/airbnb-research/</a>.</cite></p> <p><cite>Sebők, M., O. Ring, and Á. Máté (2021). <em>Szövegbányászat és mesterséges intelligencia R-ben</em>. Budapest: Typotex.</cite></p> <p><cite>Silge, J. and D. Robinson (2016). “tidytext: Text mining and analysis using tidy data principles in R”. In: <em>Journal of Open Source Software</em> 1.3, p. 37.</cite></p>