1
|
de Mattos Russo Rafael R, da Silva KP, de Souza Santos HG, Depret DG, Caravaca-Morera JA, Breda KML. Accuracy, potential, and limitations of probabilistic record linkage in identifying deaths by gender identity and sexual orientation in the state of Rio De Janeiro, Brazil. BMC Public Health 2024; 24:1475. [PMID: 38824562 PMCID: PMC11144332 DOI: 10.1186/s12889-024-19002-x] [Citation(s) in RCA: 0] [Impact Index Per Article: 0] [Reference Citation Analysis] [Abstract] [Key Words] [MESH Headings] [Grants] [Track Full Text] [Journal Information] [Subscribe] [Scholar Register] [Received: 02/02/2024] [Accepted: 05/29/2024] [Indexed: 06/03/2024] Open
Abstract
BACKGROUND Globally, the counting of deaths based on gender identity and sexual orientation has been a challenge for health systems. In most cases, non-governmental organizations have dedicated themselves to this work. Despite these efforts in generating information, the scarcity of official data presents significant limitations in policy formulation and actions guided by population needs. Therefore, this manuscript aims to evaluate the accuracy, potential, and limits of probabilistic data relationships to yield information on deaths according to gender identity and sexual orientation in the State of Rio de Janeiro. METHODS This study evaluated the accuracy of the probabilistic record linkage to obtain information on deaths according to gender and sexual orientation. Data from two information systems were used from June 15, 2015 to December 31, 2020. We constructed nine probabilistic data relationship strategies and identified the performance and cutoff points of the best strategy. RESULTS The best data blocking strategy was established through logical blocks with the first and last names, birthdate, and mother's name in the pairing strategy. With a population base of 80,178 records, 1556 deaths were retrieved. With an area under the curve of 0.979, this strategy presented 93.26% accuracy, 98.46% sensitivity, and 90.04% specificity for the cutoff point ≥ 17.9 of the data relationship score. The adoption of the cutoff point optimized the manual review phase, identifying 2259 (90.04%) of the 2509 false pairs and identifying 1532 (98.46%) of the 1556 true pairs. CONCLUSION With the identification of possible strategies for determining probabilistic data relationships, the retrieval of information on mortality according to sexual and gender markers has become feasible. Based on information from the daily routine of health services, the formulation of public policies that consider the LGBTQ + population more closely reflects the reality experienced by these population groups.
Collapse
Affiliation(s)
| | - Kleison Pereira da Silva
- School of Nursing, Public Health Nursing Department, State University of Rio de Janeiro, Rio de Janeiro, Brazil
| | | | - Davi Gomes Depret
- School of Nursing, Public Health Nursing Department, State University of Rio de Janeiro, Rio de Janeiro, Brazil
| | | | - Karen Marie Lucas Breda
- Department of Nursing, College of Education, University of Hartford, Nursing & Health Professions. West Hartford, Connecticut, United States of America
| |
Collapse
|
2
|
Madalena Ribeiro C, Dos Santos Silva I, Eluf Neto J, Pereira Baltar Cury LC, Azevedo E Silva G. Follow-up of women screened for cervical cancer in São Paulo, Brazil: An analysis of the times to diagnostic investigation and treatment. Cancer Epidemiol 2021; 72:101940. [PMID: 33906100 DOI: 10.1016/j.canep.2021.101940] [Citation(s) in RCA: 2] [Impact Index Per Article: 0.5] [Reference Citation Analysis] [Abstract] [Key Words] [Track Full Text] [Journal Information] [Subscribe] [Scholar Register] [Received: 11/05/2020] [Revised: 04/05/2021] [Accepted: 04/12/2021] [Indexed: 11/25/2022]
Abstract
BACKGROUND Cervical cancer incidence and mortality rates are higher in Brazil than in western countries. Access to cytology-based screening has increased in the country in recent decades, but few studies have assessed the quality of the follow-up care of women with abnormal screening tests that require further investigation. METHODS A record-linkage cohort study was conducted in São Paulo state. Women aged 25+ years, who were screened in 2010, and whose test revealed a high-grade, or more severe, lesion were eligible. Follow-up information on diagnostic investigations, treatments and mortality was obtained through record-linkage of health databases. The Kaplan-Meier method was used to estimate median times between screening and diagnostic investigation, and diagnosis and treatment initiation. Cox survival models were used to identify correlates of the length of these time intervals. RESULTS 4300 women had a high-grade, or more severe, test result. Of these, 2788 (64.8 %) had a diagnostic investigation record, 1763 (41 %) a confirmed diagnosis of a precursor lesion or cancer, and 1247 (70.7 %) a treatment record. The median time to diagnosis was 190 days, with the probability of undergoing a diagnostic investigation within 30 days of the abnormal screening test being 7%. The median time to treatment was 81 days, with the probability of undergoing treatment within 60 days of a confirmed diagnosis being 44 %. Delays in diagnosis and treatment were associated with area-based healthcare indicators. CONCLUSION Times to diagnosis and treatment were long, well above recommendations. Strategies to improve follow-up care must be prioritized to ensure screening reduces cervical cancer incidence and mortality.
Collapse
Affiliation(s)
| | - Isabel Dos Santos Silva
- Department of Non-Communicable Disease Epidemiology, London School of Hygiene and Tropical Medicine, London, UK.
| | - José Eluf Neto
- Department of Preventive Medicine, Faculty of Medicine, University of São Paulo, São Paulo, SP, Brazil.
| | | | | |
Collapse
|
3
|
Ali MS, Ichihara MY, Lopes LC, Barbosa GC, Pita R, Carreiro RP, dos Santos DB, Ramos D, Bispo N, Raynal F, Canuto V, de Araujo Almeida B, Fiaccone RL, Barreto ME, Smeeth L, Barreto ML. Administrative Data Linkage in Brazil: Potentials for Health Technology Assessment. Front Pharmacol 2019; 10:984. [PMID: 31607900 PMCID: PMC6768004 DOI: 10.3389/fphar.2019.00984] [Citation(s) in RCA: 39] [Impact Index Per Article: 6.5] [Reference Citation Analysis] [Abstract] [Key Words] [Track Full Text] [Download PDF] [Figures] [Journal Information] [Subscribe] [Scholar Register] [Received: 03/01/2019] [Accepted: 07/31/2019] [Indexed: 12/17/2022] Open
Abstract
Health technology assessment (HTA) is the systematic evaluation of the properties and impacts of health technologies and interventions. In this article, we presented a discussion of HTA and its evolution in Brazil, as well as a description of secondary data sources available in Brazil with potential applications to generate evidence for HTA and policy decisions. Furthermore, we highlighted record linkage, ongoing record linkage initiatives in Brazil, and the main linkage tools developed and/or used in Brazilian data. Finally, we discussed the challenges and opportunities of using secondary data for research in the Brazilian context. In conclusion, we emphasized the availability of high quality data and an open, modern attitude toward the use of data for research and policy. This is supported by a rigorous but enabling legal framework that will allow the conduct of large-scale observational studies to evaluate clinical, economical, and social impacts of health technologies and social policies.
Collapse
Affiliation(s)
- M Sanni Ali
- Faculty of Epidemiology and Population Health, Department of Non-communicable Disease Epidemiology, London School of Hygiene and Tropical Medicine, London, United Kingdom
- Nuffield Department of Orthopaedics, Rheumatology and Musculoskeletal Sciences (NDORMS), Center for Statistics in Medicine (CSM), University of Oxford, Oxford, United Kingdom
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
| | - Maria Yury Ichihara
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
- Institute of Public Health, Federal University of Bahia (UFBA), Salvador, Brazil
| | | | - George C.G. Barbosa
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
| | - Robespierre Pita
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
| | - Roberto Perez Carreiro
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
| | | | - Dandara Ramos
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
| | - Nivea Bispo
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
| | - Fabiana Raynal
- Department of Management and Incorporation of Health Technology, Ministry of Health (DGITS/MS), Brasília, Brazil
| | - Vania Canuto
- Department of Management and Incorporation of Health Technology, Ministry of Health (DGITS/MS), Brasília, Brazil
| | - Bethania de Araujo Almeida
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
| | - Rosemeire L. Fiaccone
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
- Institute of Public Health, Federal University of Bahia (UFBA), Salvador, Brazil
- Department of Statistics, Federal University of Bahia (UFBA), Salvador, Brazil
| | - Marcos E. Barreto
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
- Department of Computing, Federal University of Bahia (UFBA), Salvador, Brazil
- Institute of Health Informatics, University College London, London, United Kingdom
| | - Liam Smeeth
- Faculty of Epidemiology and Population Health, Department of Non-communicable Disease Epidemiology, London School of Hygiene and Tropical Medicine, London, United Kingdom
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
| | - Mauricio L. Barreto
- Centre for Data and Knowledge Integration for Health (CIDACS), Instituto Gonçalo Muniz, Fundação Osvaldo Cruz, Salvador, Brazil
- Institute of Public Health, Federal University of Bahia (UFBA), Salvador, Brazil
| |
Collapse
|
4
|
Duarte DDAP, Corrêa CSL, Fayer VA, Nogueira MC, Bustamante-Teixeira MT. Avaliação de método para classificação automatizada de pares em relacionamentos probabilísticos de bancos de dados. CAD SAUDE PUBLICA 2019; 35:e00066419. [DOI: 10.1590/0102-311x00066419] [Citation(s) in RCA: 0] [Impact Index Per Article: 0] [Reference Citation Analysis] [Abstract] [Track Full Text] [Journal Information] [Subscribe] [Scholar Register] [Received: 04/05/2019] [Accepted: 08/23/2019] [Indexed: 11/21/2022] Open
Abstract
Resumo: O objetivo foi testar e avaliar a acurácia de um método para a seleção de escore em relacionamento probabilístico de banco de dados, de forma a viabilizar a automatização da identificação de pares verdadeiros dispensando a etapa de inspeção manual. Estudo de acurácia utilizando dados do Sistema de Informação do Câncer de Mama (SISMAMA) de Minas Gerais, Brasil, de 2009 e 2010. Após o processo de limpeza e padronização, foi realizado o relacionamento probabilístico dos bancos 2009 e 2010 utilizando 16 passos, sendo que cada passo foi inspecionado manualmente para se obter um padrão-ouro. Posteriormente, selecionaram-se amostras que foram inspecionadas e avaliadas para calcular a acurácia do método de seleção dos pares verdadeiros. Todos os passos e amostras com 200 e 300 pares apresentaram alta sensibilidade (recall) > 0,97, alto valor preditivo positivo (precision) > 0,95 e altas acurácia (> 0,97), medida F (> 0,96) e área sob a curva precision-recall (> 0,98). A amostra com 100 pares evidenciou altos valores para essas medidas, porém com escores mais baixos. Dos 16 passos avaliados, o uso de apenas três de forma combinada foi suficiente para identificar 99,24% dos pares verdadeiros no banco total. O método proposto permite automatizar o relacionamento das bases de dados, mantendo a acurácia do método. Facilita a utilização de relacionamento probabilístico no âmbito dos serviços de saúde, especialmente para a vigilância e gestão em saúde.
Collapse
|
5
|
Brustulin R, Marson PG. Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico. CAD SAUDE PUBLICA 2018; 34:e00088117. [DOI: 10.1590/0102-311x00088117] [Citation(s) in RCA: 0] [Impact Index Per Article: 0] [Reference Citation Analysis] [Abstract] [Track Full Text] [Journal Information] [Subscribe] [Scholar Register] [Received: 05/23/2017] [Accepted: 03/12/2018] [Indexed: 11/22/2022] Open
Abstract
O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informação de Agravos de Notificação e o Sistema de Informações sobre Mortalidade, no período de 2007 a 2015, do Município de Palmas, Tocantins, Brasil. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, já as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, apresentaram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante à obtida pela etapa de pós-processamento determinístico, no entanto, o número de pares destinados à revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade.
Collapse
|
6
|
Peres SV, Latorre MDRDDO, Tanaka LF, Michels FAS, Teixeira MLP, Coeli CM, Almeida MFD. Melhora na qualidade e completitude da base de dados do Registro de Câncer de Base Populacional do município de São Paulo: uso das técnicas de linkage. REVISTA BRASILEIRA DE EPIDEMIOLOGIA 2016; 19:753-765. [DOI: 10.1590/1980-5497201600040006] [Citation(s) in RCA: 9] [Impact Index Per Article: 1.0] [Reference Citation Analysis] [Abstract] [Track Full Text] [Journal Information] [Subscribe] [Scholar Register] [Received: 09/02/2015] [Accepted: 05/30/2016] [Indexed: 11/21/2022] Open
Abstract
RESUMO: A disponibilidade de grandes bases de dados informatizadas em saúde tornou a técnica de linkage uma alternativa para diferentes tipos de estudos, proporcionando a geração de uma base de dados mais completa e de baixo custo operacional. Objetivo: Melhorar a qualidade e a completitude dos casos incidentes de câncer por meio dos linkages probabilístico e determinístico entre o Registro de Câncer de Base Populacional de São Paulo (RCBP-SP), o banco de dados de óbitos e de Autorização e Procedimentos de Alta Complexidade. Método: Foi utilizado o banco de dados do RCBP-SP, composto de 343.306 casos de câncer incidentes no município de São Paulo entre 1997 e 2005, com idades entre 1 e 106 anos, de ambos os sexos. Para o linkage foram utilizadas três bases de dados, a saber: do Programa de Aprimoramento de Mortalidade no Município de São Paulo (PRO-AIM), da Fundação SEADE e da Autorização e Procedimentos de Alta Complexidade/Custo do Sistema de Informação Ambulatorial do Sistema Único de Saúde (APAC-SIA/SUS). Foram analisadas os coeficientes brutos de incidência (CBI) e mortalidade (CBM) e a sobrevida global pela técnica de Kaplan-Meier. Resultados: Após o linkage, verificou-se um ganho de 4,3% para a CBI e 25,8% para a CBM. Na análise de sobrevida global antes do linkage havia uma subestimação da probabilidade de estar vivo para todas as variáveis analisadas (p < 0,001). Conclusão: As técnicas de linkage contribuíram para a melhora da qualidade da informação do RCBP-SP tanto na completitude das variáveis quanto na definição do status vital do paciente, refletindo a capacidade das bases de dados, quando trabalhadas de maneira conjunta, de fornecerem subsídios para diversos tipos de estudos e informações para o planejamento de ações políticas e estratégicas.
Collapse
|