Imágenes desgarradas: el uso de scrapers en investigación social en Instagram sobre cáncer

  • Miguel Varela-Rodríguez Universidad de Valladolid
  • Miguel Vicente-Mariño Universidad de Valladolid
Palabras clave: investigación en redes sociales, comunicación en salud, sociología visual, cáncer, métodos computacionales en investigación social

Resumen

El uso de redes de contenido visual como Instagram está bien documentado en la comunicación en salud, especialmente el análisis de contenido para estudiar las imágenes. Sin embargo, esta metodología supone un reto ante las crecientes dificultades en el acceso y un marco legal y de actuación muy limitados. Basado en los postulados de la sociología visual, este artículo explora una metodología para obtener datos de Instagram mediante el uso de scrapers, revisando las necesidades técnicas y las implicaciones éticas en el uso de este tipo de herramientas. Se analiza la distribución de imágenes acompañadas por la etiqueta #SacaPecho, creada por la Asociación Española Contra el Cáncer con ocasión del Día Internacional de la Lucha Contra el Cáncer (19 de octubre de 2020). El uso de scrapers permite obtener referencias de más de 7000 imágenes en poco tiempo. El trabajo permite entender las herramientas al alcance de la investigación social para acceder a datos relevantes en Instagram y propone un debate sobre las posibilidades éticas en este ámbito.

Biografía del autor/a

Miguel Varela-Rodríguez , Universidad de Valladolid

Sociólogo y Profesor Asociado en el Departamento de Sociología y Trabajo Social de la Universidad de Valladolid. Su trabajo de investigación se centra en el análisis del discurso visual, con especial atención a las redes sociales y a la tecnología digital aplicada al trabajo de paz y a la sociología de la salud. Con formación en fotografía documental. Con un MA en Fotoperiodismo y Fotografía Documental por la Universidad de las Artes de Londres y un MSc en Trabajo de Paz y Desarrollo por la Universidad Lineo, es miembro de la International Visual Sociology Association.

Miguel Vicente-Mariño , Universidad de Valladolid

Profesor Titular de la Universidad de Valladolid, donde dirige el Departamento de Sociología y Trabajo Social y coordina el Grupo de Investigación Reconocido en Ciencias Sociales Aplicadas. Doctor en Comunicación Audiovisual por la Universitat Autònoma de Barcelona, sus líneas de investigación se centran en el análisis de las audiencias y de los contenidos de los medios de comunicación masiva y de las redes sociales digitales, con especial atención a las innovaciones metodológicas y a las herramientas informáticas.

Citas

Abidin, C. (2016). “Aren’t These Just Young, Rich Women Doing Vain Things Online?”: Influencer Selfies as Subversive Frivolity. Social Media + Society, 2(2), 2056305116641342. https://doi.org/10.1177/2056305116641342

Abril Curto, G. (2013). Cultura visual, de la semiótica a la política (Visual culture, from semiotics to politics). Plaza y Valdés.

Abutaleb, Y. (2016, June 21). Instagram’s user base grows to more than 500 million. Reuters. Retrieved from https://www.reuters.com/article/us-facebook-instagram-users-idUSKCN0Z71LN

Arcila-Calderón, C., Ortega-Mohedano, F., Álvarez, M., & Vicente-Mariño, M. (2019). Análisis distribuido y supervisado de sentimientos en Twitter: Integrando aprendizaje automático y analítica en tiempo real para retos de dimensión big data en investigación de comunicación y audiencias (Distributed Supervised Sentiment Analysis of Tweets: Integrating Machine Learning and Streaming Analytics for Big Data Challenges in Communication and Audience Research). Empiria. Revista de metodología de ciencias sociales, (42), 113-136. https://doi.org/10.5944/empiria.42.2019.23254

Asociación Española Contra el Cáncer (AECC). (2020, October 9). La AECC anima a “sacar pecho” contra el cáncer de mama. AECC Noticias. Retrieved from https://www.aecc.es/es/actualidad/noticias/aecc-anima-sacar-pecho-contra-cancer-mama

Babvey, P., Capela, F., Cappa, C., Lipizzi, C., Petrowski, N., & Ramirez-Marquez, J. (2020). Using social media data for assessing children’s exposure to violence during the COVID-19 pandemic. Child Abuse & Neglect, 104747. https://doi.org/10.1016/j.chiabu.2020.104747

Basch, C. H. & MacLean, S. A. (2019). Breast Cancer on Instagram: A Descriptive Study. International Journal of Preventive Medicine, 10(1), 166. https://doi.org/10.4103/ijpvm.IJPVM_36_19

Becker, H. S. (1974). Photography and Sociology. Studies in the Anthropology of Visual Communication, 1(1), 3-26. Retrieved from https://repository.upenn.edu/cgi/viewcontent.cgi?article=1003&context=svc

Berger, J. (2016). Modos de ver: Basado en la serie de la televisión BBC en colaboración con John Berger (Ways of Seeing: Based on the BBC Television Series). Barcelona, Spain: Gustavo Gili.

Blanch-Hartigan, D. & Viswanath, K. (2015). Socioeconomic and sociodemographic predictors of cancer-related information sources used by cancer survivors. Journal of Health Communication, 20(2), 204-210. https://doi.org/10.1080/10810730.2014.921742

Bruns, A. (2019). After the ‘APIcalypse’: Social media platforms and their fight against critical scholarly research. Information, Communication & Society, 22(11), 1544-1566. https://doi.org/10.1080/1369118X.2019.1637447

Cartwright, L. (1998). Community and the Public Body in Breast Cancer Media Activism. Cultural Studies, 12(2), 117-138. https://doi.org/10.1080/095023898335500

Chou, W.-Y. S., Trivedi, N., Peterson, E., Gaysynsky, A., Krakow, M., & Vraga, E. (2020). How do social media users process cancer prevention messages on Facebook? An eye-tracking study. Patient Education and Counseling, 103(6), 1161-1167. https://doi.org/10.1016/j.pec.2020.01.013

Cinelli, M., Quattrociocchi, W., Galeazzi, A., Valensise, C. M., Brugnoli, E., Schmidt, A. L., Zola, P., Zollo, F., & Scala, A. (2020). The COVID-19 Social Media Infodemic. Sci Rep, (10), 16598. https://doi.org/10.1038/s41598-020-73510-5

Couture Bue, A. C. (2020). The looking glass selfie: Instagram use frequency predicts visual attention to high-anxiety body regions in young women. Computers in Human Behavior, 108, 106329. https://doi.org/10.1016/j.chb.2020.106329

Dewi, L.C., Meiliana, & Chandra, A. (2019). Social Media Web Scraping using Social Media Developers API and Regex. Procedia Computer Science, 157, 444-449. https://doi.org/10.1016/j.procs.2019.08.237

Döbrössy, B., Girasek, E., Susánszky, A., Koncz, Z., Győrffy, Z., & Bognár, V. K. (2020). «Clicks, likes, shares and comments» a systematic review of breast cancer screening discourse in social media. PLOS ONE, 15(4), e0231422. https://doi.org/10.1371/journal.pone.0231422

Ehrenreich, B. (2001, November). Welcome to Cancerland: A Mamogram Leads to a Cult of Pink Kitsch. Harper’s Magazine. Retrieved from https://harpers.org/archive/2001/11/welcome-to-cancerland/

Gibson, F., Hibbins, S., Grew, T., Morgan, S., Pearce, S., Stark, D., & Fern, L. A. (2016). How young people describe the impact of living with and beyond a cancer diagnosis: Feasibility of using social media as a research method. Psycho-Oncology, 25(11), 1317-1323. https://doi.org/10.1002/pon.4061

Giraldo-Luque, S., Fernández-García, N., & Pérez-Arce, J. C. (2018). La centralidad temática de la movilización #NiUnaMenos en Twitter (Thematic centrality on Twitter: The case of# NiUnaMenos mobilisation). El profesional de la información, 27(1), 96-105. Retrieved from http://profesionaldelainformacion.com/contenidos/2018/ene/09.pdf

González Requena, J. (1988). El discurso televisivo: Espectáculo de la posmodernidad (The television discourse: Spectacle of postmodernity). Madrid, Spain: Cátedra.

González Requena, J. (2013). El ser de las imágenes: De la teoría al análisis de imagen (The Being of Images: From Theory to Image Analysis). www.gonzalezrequena.com. Retrieved from http://gonzalezrequena.com/textos-en-linea-0-2/libros-en-linea/el-ser-de-las-imagenes/

Grant, J. A. & Hundley, H. (2008). Fighting the Battle or Running the Race? Visual Communication Quarterly, 15(3), 180-195. https://doi.org/10.1080/15551390802235578

Hand, M. (2016). Visuality in Social Media: Researching Images, Circulations and Practices. In L. Sloan & A. Quan-Haase (Eds.), The SAGE Handbook of Social Media Research Methods (pp. 215-231). SAGE Publications Ltd.

Harper, D. (1988). Visual Sociology: Expanding Sociological Vision. The American Sociologist, (19), 54-70. https://doi.org/10.1007/BF02692374

Harper, D. (1996). Seeing Sociology. The American Sociologist, 27(3), 69-78. Retrieved from https://www.jstor.org/stable/27698785

Harrigan, P., Daly, T. M., Coussement, K., Lee, J. A., Soutar, G. N., & Evers, U. (2020). Identifying influencers on social media. International Journal of Information Management, (56), 102246. https://doi.org/10.1016/j.ijinfomgt.2020.102246

Henricks, S. C. (2017). Social Media, Publicly Available Information, and the Intelligence Community. American Intelligence Journal, 34(1), 21-31. Retrieved from https://www.jstor.org/stable/26497113

Highfield, T. & Leaver, T. (2014). A methodology for mapping Instagram hashtags. First Monday, 20(1). https://doi.org/10.5210/fm.v20i1.5563

Himawan, A., Priadana, A., & Murdiyanto, A. (2020). Implementation of Web Scraping to Build a Web-Based Instagram Account Data Downloader Application. IJID (International Journal on Informatics for Development), 9(2), 59-65. https://doi.org/10.14421/ijid.2020.09201

Hirschey, J. (2014). Symbiotic Relationships: Pragmatic Acceptance of Data Scraping. SSRN Electronic Journal, (29). https://doi.org/10.2139/ssrn.2419167

Instagram. (2018). Condiciones de uso (Terms of use). Retrieved from https://help.instagram.com/581066165581870?ref=dp

Jang, J. Y., Han, K., Shih, P. C., & Lee, D. (2015). Generation Like: Comparative Characteristics in Instagram. Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems, 4039-4042. https://doi.org/10.1145/2702123.2702555

Kligler-Vilenchik, N., Baden, C., & Yarchi, M. (2020). Interpretative polarization across platforms: How political disagreement develops over time on Facebook, Twitter, and WhatsApp. Social Media + Society, 6(3), 2056305120944393. https://doi.org/10.1177/2056305120944393

Lama, Y., Hu, D., Jamison, A., Quinn, S. C., & Broniatowski, D. A. (2019). Characterizing Trends in Human Papillomavirus Vaccine Discourse on Reddit (2007-2015): An Observational Study. JMIR Public Health and Surveillance, 5(1), e12480. https://doi.org/10.2196/12480

Manovich, L. (2016). Instagram and Contemporary Image. manovich. Retrieved from http://manovich.net/content/04-projects/151-instagram-and-contemporary-image/instagram_book_manovich_2017.pdf

Manovich, L. (2018). AI Aesthetics. Moscow, Russia: Strelka Press.

Markham, A. N. & Buchanan, E. (2012). Ethical Decision-Making and Internet Research: Recommendations from the AOIR Ethics Working Committee (Version 2.0). Association of Internet Researchers. Retrieved from https://aoir.org/ethics/

Markham, A. N. & Buchanan, E. (2017). Research Ethics in Context: Decision-Making in Digital Research. In M. T. Schäfer & K. Es, van (Eds.), The Datafied Society. Studying Culture through Data. Amsterdam, The Netherlands: Amsterdam University Press.

Marres, N. & Weltevrede, E. (2013). SCRAPING THE SOCIAL?: Issues in live social research. Journal of Cultural Economy, 6(3), 313-335. https://doi.org/10.1080/17530350.2013.772070

Munk, A. K., Abildgaard, M. S., Birkbak, A., & Petersen, M. K. (2016). (Re-)Appropriating Instagram for Social Research: Three Methods for Studying Obesogenic Environments. Proceedings of the 7th 2016 International Conference on Social Media & Society, 1-10. https://doi.org/10.1145/2930971.2930991

Noar, S. M., Leas, E., Althouse, B. M., Dredze, M., Kelley, D., & Ayers, J. W. (2018). Can a selfie promote public engagement with skin cancer? Preventive Medicine, (111), 280-283. https://doi.org/10.1016/j.ypmed.2017.10.038

Nobles, A. L., Leas, E. C., Noar, S., Dredze, M., Latkin, C. A., Strathdee, S. A., & Ayers, J. W. (2020). Automated image analysis of instagram posts: Implications for risk perception and communication in public health using a case study of #HIV. PLOS ONE, 15(5), e0231155. https://doi.org/10.1371/journal.pone.0231155

Orduña-Malea, E., Font-Julián, C. I., & Ontalba-Ruipérez, J.-A. (2020). Covid-19: Análisis métrico de vídeos y canales de comunicación en YouTube (Covid-19: metric analysis of videos and communication channels on YouTube). Profesional de la Información, 29(4), e290401. https://doi.org/10.3145/epi.2020.jul.01

Pardo, R. (2019). Fotografía y enfermedad: Iconografías en transformación (Photography and disease: Iconographies in transformation). In M. Morcate & R. Pardo (Eds.), La imagen desvelada: Prácticas fotográficas en la enfermedad, la muerte y el duelo (The Unveiled Image: Photographic Practices in Illness, Death, and Grief) (pp. 19-60). Vitoria-Gasteiz, Spain: Sans Soleil Ediciones.

Pauwels, L. (2015). Reframing Visual Social Science: Towards a More Visual Sociology and Anthropology. Cambridge University Press. https://doi.org/10.1017/CBO9781139017633

Prosser, J., Clark, A., & Wiles, R. (2008). Visual Research Ethics at the Crossroads. NCRM Working Paper. Manchester, Reino Unido:Realities, Morgan Centre. Retrieved from http://eprints.ncrm.ac.uk/535/

Purba, K. R., Asirvatham, D., & Murugesan, R. K. (2020). Influence maximization diffusion models based on engagement and activeness on instagram. Journal of King Saud University - Computer and Information Sciences. https://doi.org/10.1016/j.jksuci.2020.09.012

Record, R. A., Silberman, W. R., Santiago, J. E., & Ham, T. (2018). I Sought It, I Reddit: Examining Health Information Engagement Behaviors among Reddit Users. Journal of Health Communication, 23(5), 470-476. https://doi.org/10.1080/10810730.2018.1465493

Regueira, U., Ferreiro, A. A., & Vila, S. D. (2020). La mujer en YouTube: Representación y participación a través de la técnica Web Scraping (Women on YouTube: Representation and participation through the Web Scraping technique). Comunicar: Revista científica iberoamericana de comunicación y educación, 63, 31-40. https://doi.org/10.3916/C63-2020-03

Rogers, R. (2018). Social Media Research After the Fake News Debacle (Dataset). University of Salento. https://doi.org/10.1285/I20356609V11I2P557

Rose, G. (2019). Metodologías visuales: Una introducción a la investigación con materiales visuales (Visual Methodologies. An Introduction to Researching with Visual Materials). Murcia, Spain: CENDEAC.

Schie, van, G., Westra, I., & Schäfer, M. T. (2017). Get Your Hands Dirty: Emerging Data Practices as Challenge for Research Integrity. In M. T. Schäfer & K. Es, van (Eds.), The Datafied Society. Studying Culture through Data, 183-200. Amsterdam University Press. https://doi.org/10.5117/9789462981362

Schrading, N., Ovesdotter Alm, C., Ptucha, R., & Homan, C. (2015). An Analysis of Domestic Abuse Discourse on Reddit. Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, 2577-2583. https://doi.org/10.18653/v1/D15-1309

Sontag, S. (1978). Illness As Metaphor. Farrar, Straus and Giroux.

Sontag, S. (2017). Sobre la fotografía (On photography). Debolsillo.

Spence, J. (1986). Putting myself in the picture: A political, personal, and photographic autobiography. Camden, United Kingdom: Camden Press.

Sutton, J., Vos, S. C., Olson, M. K., Woods, C., Cohen, E., Gibson, C. B., Phillips, N. E., Studts, J. L., Eberth, J. M., & Butts, C. T. (2018). Lung Cancer Messages on Twitter: Content Analysis and Evaluation. Journal of the American College of Radiology, 15(1), 210-217. https://doi.org/10.1016/j.jacr.2017.09.043

Tafesse, W. & Wood, B. P. (2020). Followers’ engagement with instagram influencers: The role of influencers’ content and engagement strategy. Journal of Retailing and Consumer Services, (58), 102303. https://doi.org/10.1016/j.jretconser.2020.102303

Townsend, L., & Wallace, C. (2016). Social Media Research: A Guide to Ethics. The University of Aberdeen. https://www.gla.ac.uk/media/Media_487729_smxx.pdf

Walsh, M. & Baker, S. A. (2017). The selfie and the transformation of the public–private distinction. Information Communication and Society, (20), 1185-1203. https://doi.org/10.1080/1369118X.2016.1220969

Wang, X., Chen, L., Shi, J., & Peng, T.-Q. (2019). What makes cancer information viral on social media? Computers in Human Behavior, (93), 149-156. https://doi.org/10.1016/j.chb.2018.12.024

White, C. L. & Boatwright, B. (2020). Social media ethics in the data economy: Issues of social responsibility for using Facebook for public relations. Public Relations Review, 46(5), 101980. https://doi.org/10.1016/j.pubrev.2020.101980

Zarei, K., Farahbakhsh, R., Crespi, N., & Tyson, G. (2020). A First Instagram Dataset on COVID-19. arXiv:2004.12226 [cs]. Retrieved from http://arxiv.org/abs/2004.12226

Zhang, J., Le, G., Larochelle, D., Pasick, R., Sawaya, G. F., Sarkar, U., & Centola, D. (2019). Facts or stories? How to use social media for cervical cancer prevention: A multi-method study of the effects of sender type and content type on increased message sharing. Preventive Medicine, 126, 105751. https://doi.org/10.1016/j.ypmed.2019.105751

Publicado
2021-04-19
Cómo citar
Varela-Rodríguez , M., & Vicente-Mariño , M. (2021). Imágenes desgarradas: el uso de scrapers en investigación social en Instagram sobre cáncer. Cuadernos.Info , (49), 72-97. https://doi.org/10.7764/cdi.49.27809