{"id":35619771,"url":"https://github.com/scieloorg/standardized-citations","last_synced_at":"2026-01-05T06:04:13.712Z","repository":{"id":40736805,"uuid":"264235487","full_name":"scieloorg/standardized-citations","owner":"scieloorg","description":"Processos para normalizar referências citadas nos documentos SciELO","archived":false,"fork":false,"pushed_at":"2023-07-20T15:07:35.000Z","size":50,"stargazers_count":0,"open_issues_count":2,"forks_count":0,"subscribers_count":6,"default_branch":"master","last_synced_at":"2024-04-14T20:25:32.404Z","etag":null,"topics":[],"latest_commit_sha":null,"homepage":null,"language":"Python","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"bsd-2-clause","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/scieloorg.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null}},"created_at":"2020-05-15T15:52:20.000Z","updated_at":"2022-11-10T16:24:24.000Z","dependencies_parsed_at":"2023-01-22T05:03:48.547Z","dependency_job_id":null,"html_url":"https://github.com/scieloorg/standardized-citations","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/scieloorg/standardized-citations","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/scieloorg%2Fstandardized-citations","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/scieloorg%2Fstandardized-citations/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/scieloorg%2Fstandardized-citations/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/scieloorg%2Fstandardized-citations/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/scieloorg","download_url":"https://codeload.github.com/scieloorg/standardized-citations/tar.gz/refs/heads/master","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/scieloorg%2Fstandardized-citations/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":28214409,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","status":"online","status_checked_at":"2026-01-05T02:00:06.358Z","response_time":57,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":[],"created_at":"2026-01-05T06:02:41.610Z","updated_at":"2026-01-05T06:04:13.707Z","avatar_url":"https://github.com/scieloorg.png","language":"Python","funding_links":[],"categories":[],"sub_categories":[],"readme":"# standardized-citations (repositório descontinuado em favor de https://github.com/scieloorg/cited-references)\n\nEste repositório concentra métodos utilizados para normalizar referências citadas nos documentos SciELO. O processo de normalização consiste em duas etapas, a saber:\n\n1. Limpar referências citadas\n2. Enriquecê-las com dados coletados em bases externas (CrossRef e bases ad hoc)\n\n\n## Instalação\n`docker build --tag standardized-citations:0.1 .`\n\n__Insumos__\n- Arquivo binário contendo bases de correção de periódicos (`bc-v1.bin`)\n\n## Como Usar\n\n1. Normalizar referências citadas em PIDs publicados de 2021-02-01 a 2021-02-07 usando métodos exato e aproximado e persistindo em JSON:\n\n`docker run --rm -v {HOST_DIR_DATA}:/opt/data standardized-citations:0.1 normalize -f 2021-02-01 -u 2021-02-07 -x -z -d /opt/data/bc-v1.bin`\n\n2. Coletar metadados Crossref para referências citadas em PIDs publicados entre 2021-02-01 e 2021-02-07:\n\n`docker run --rm -v {HOST_DIR_DATA}:/opt/data standardized-citations:0.1 crossref -f 2021-02-01 -u 2021-02-07`\n\n__Notas__\n- É preciso ter um e-mail registrado no serviço Crossref\n- Os resultados, por padrão, são persistidos em arquivos JSON no diretório DIR_DATA\n- É possível persistir os resultados em um banco de dados MongoDB (ao informar uma string de conexão)\n\n\n\n## Parâmetros do standardizer\n\n| Parâmetro | Nome | Descrição |\n|-----------|------|-----------|\n|-z|--fuzzy|Ativa casamento aproximado de títulos de periódicos|\n|-x|--fuzzy|Ativa casamento exato de títulos de periódicos|\n||--mongo_uri|String de conexão com banco de dados MongoDB|\n|-d|--database|Arquivo binário da base de correção de títulos|\n|-f|--from_date|Data a partir da qual os PIDs serão coletados no ArticleMeta e suas referências citadas serão normalizadas|\n|-u|--until_date|Data até a qual os PIDs serão coletados no ArticleMeta e suas referências citadas serão normalizadas|\n\n\n## Parâmetros do CrossrefAsyncCollector\n\n| Parâmetro | Nome | Descrição |\n|-----------|------|-----------|\n||--mongo_uri|String de conexão com banco de dados MongoDB|\n|-e|--email|E-mail registrado no serviço Crossref|\n|-f|--from_date|Data a partir da qual os PIDs serão coletados no ArticleMeta|\n|-u|--until_date|Data até a qual os PIDs serão coletados no ArticleMeta|\n\n\n## Referências\n\n- [Normalização de citações](https://docs.google.com/document/d/1iwkt0Nr6P9Or2_RQbIbyA_rEiLkXIo-Yws2vw3gfDes/edit?usp=sharing)\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fscieloorg%2Fstandardized-citations","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fscieloorg%2Fstandardized-citations","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fscieloorg%2Fstandardized-citations/lists"}