

« 2025/3 »

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
2021. 7. 23. 08:27

빅데이터분석기사 합격 공부/통계학2021. 7. 23. 08:27

처음 채점때 웃기게도 3과목이 0점이 나와서 재채점 신청했더니 만점을 받았다
나중에 시험 후기도 써야겠다

Posted by 시스메
2020. 5. 28. 17:11

스크랩 공부/통계학2020. 5. 28. 17:11

Posted by 시스메
2020. 5. 15. 10:43

- 공부/통계학2020. 5. 15. 10:43



지금하는 프로젝트

Survey 패키지


Posted by 시스메

Posted by 시스메

맥니마 검정(McNemar test)의 확장형 McNemar-Bowker test와 코크란 Q 검정(Cochran’s Q test), 그리고 Friedman test


Posted by 시스메

Concomitant AF with OLD patients를 대상으로 각 rate control 약에 대한 사망률 비교 

Data : 건강보험공단 CDM 자료 

결론 : Digoxin < CCB < Beta blocker 순으로 생존률이 좋다.

Posted by 시스메

Posted by 시스메
2019. 7. 18. 11:45

OHDSI publications 공부/통계학2019. 7. 18. 11:45


Preserving temporal relations in clinical data while maintaining privacy



Editor's Choice: Preserving temporal relations in clinical data while maintaining privacy

Objective Maintaining patient privacy is a challenge in large-scale observational research. To assist in reducing the risk of identifying study subjects through publicly available data, we introduce a method for obscuring date information for clinical ...



The role of electronic healthcare record databases in paediatric drug safety surveillance: a retrospective cohort study



The role of electronic healthcare record databases in paediatric drug safety surveillance: a retrospective cohort study

Electronic healthcare record (EHR)-based surveillance systems are increasingly being developed to support early detection of safety signals. It is unknown what the power of such a system is for surveillance among children and adolescents. In this paper ...



Birth month affects lifetime disease risk: a phenome-wide method



Editor's Choice: Birth month affects lifetime disease risk: a phenome-wide method

Objective An individual’s birth month has a significant impact on the diseases they develop during their lifetime. Previous studies reveal relationships between birth month and several diseases including atherothrombosis, asthma, attention deficit ...




Posted by 시스메
2019. 7. 17. 21:13

개인 공부 공부/통계학2019. 7. 17. 21:13

메타분석이란 동일하거나 유사한 주제로 연구되어진 많은 연구물들의 결과를 객관적으로, 그리고 계량적으로 종합하여 고찰하는 연구방법을 말한다. 즉 메타분석은 문헌연구가 갖는 제한적인 여러 가지 한계를 넘어서 개별 연구결과들을 통계적으로 통합 또는 비교하여 포괄적이고 거시적인 연구 결론을 이끌어 낼 수 있는 연구방법이다. 이런 양적 접근의 종합적 분석연구는 1930년 전부터 이미 통계학자들의 관심 속에 연구가 되어오고 있고, 1976년 Glass에 의해 연구결과들의 분석(analysis of analyses)이라는 뜻을 가진 ‘메타분석’이란 용어가 처음 소개가 되었다.

메타분석에는 크게 세 가지 다른 접근방법들이 있는데 투표계산법(vote-counting method) 또는 투표계산 추정방법(vote-counting estimation procedures), 유의도 검증 분석(analysis of significance levels), 그리고 효과크기분석(analysis of effect-magnitude measures)이다. 만일 각각의 개별 연구들이 서로 다른 모수들이나 구인들의 검사로 이루어져서 어떠한 공통의 척도로 전환이 불가능하다면 유의도 검증 분석을 사용하고, 효과크기 분석은 다른 메타분석의 접근방법들보다 단일 연구결과 구인들의 연구에 훨씬 많은 정보를 우리에게 제공한다. 왜냐하면 효과크기 분석은 연구자들에게 모집단의 효과크기에 대한 특별한 값에 대한 가설을 검정할 수 있게 해주기 때문이다. 그리고 연구 특징들로부터 효과크기를 예측할 수 있도록 모델을 만들 수 있다. 메타분석에서 다루고 있는 과제들은 전체적 효과의 크기, 효과사이의 변동(Variation in effects), 연구 특징들의 차이, 그리고 서로 다른 연구결과의 효과크기 비교 등이다.

동일한 또는 유사한 연구 질문에 대한 결과도출이 예전보다 더 복잡해지고 있고, 서로 관련된 연구물들이 증가함으로써, 연구물들이 서로 일치된 결과를, 때로는 서로 전혀 상반된 연구결과를 내는 경우도 보게 되는데, 메타분석은 표본의 크기 차이를 포함하여 다양한 연구설계의 조건들, 그리고 표본이 추출된 모집단들의 여러 가지 특징들이 연구마다 다른 경우 등과 같이 서로 다른 특징과 조건들을 가진 연구결과들 속에서 타당성 있는 일반화된 결론을 이끌어내는 것이다.


[네이버 지식백과] 메타분석 [meta analysis] (교육평가용어사전, 2004. 5. 31., 한국교육평가학회)


CDM 정리



3. CDM ( 공통 데이터 모델 정리 )

의료 빅데이터의 종류 전자의무기록 환자질병 등록 정보 환자 건강 모니터링 기기 자료 유전체 정보 보험청구자료 의료기관의 정보시스템의 예 전자의무기록(Electronic Medical Records : EMR) : 환자의 진료정보..



카이스퀘어 검정



카이스퀘어 검정방법

경영통계 중 카이스퀘어 검정방법에 대해 잘 설명한 글이 있어 공유합니다. 카이스퀘어분포는 독립변수가 명목치인 어떤 표본이 모집단의 분포와 같냐 다르냐를 검정할 때 많이 쓰입니다. 카이스퀘어 검정은 다음 3가지로 나눌 수 있습니다. 하지만, 하는 방법



이쪽 용어를 잘 모르니까 대충만 알겠다 

CDM을 굳이 써야하는 이유는? 지금까지는 통합되지 않아서 분석하지 못한 경우가 많았던걸까. 

cohort가 뭐더라 배웠는데 ㅠ 

생명표는 어떤 코호트(cohort)에서 현재의 사망 수준이 그대로 지속된다는 가정 하에 나이가 많아짐에 따라 연령별로 몇 세까지 살 수 있는지에 대한 사망률을 추정하는 통계분석 모듈입니다. 연령 마다 누적 생존율, 사건 발생 수(사망 수), 사망률을 기반으로 각 연령의 평균 여명(기대수명)을 계산할 수 있습니다.


Complex Cohort Segments use case

In order to identify the best groups of user cohorts to target, they want to create very specific cohort groups.

How do you do a cohort analysis?

Cohort analysis is a subset of behavioral analytics that looks at groups of people (users) who have taken a common action during a select period of time. Rather than looking at all of your users as a single unit, cohort analysis breaks them into groups to help identify patterns throughout the customer lifecycle.

CMR : computerized medical record, 의사들이 컴퓨터에 넣는 기록 


MEDLINE은 NLM 최고 서지 데이터베이스로 의학, 간호학등 생명 의학 분야의 저널 기사에 대한 서지 정보를 제공한다. 데이터베이스안에는 1946년 부터 현재까지의 인용자료가 포함되어 있다.

MEDLINE은 현재 전세계에 발행된 약 5,600개 이상의 학술 저널 참고문헌이 담겨있다. MEDLINE 데이터베이스는 PubMed 데이터베이스의 일부로서 직접 검색이 가능하다. MEDLINE 은 PubMed의 나머지 부분과 차별화 된 점은 NLM의 통제어휘인 MeSH(의학용어 분류집)을 사용하여 참고문헌을 추가할 수 있다.

[출처] PubMed 와 MEDLINE|작성자 박만복




​PubMed란 미국 국립의학도서관 (National Libray Medicine, NLM)에서 제작한 생명과학 및 생물의...




ETL 과정 : Extract, Transform, Load

=> ETL 정의서 


vocabulary 종류

SNOMED-CT : 글로벌 표준 임상용어집

LOINC(Logical Observation Identifiers Names and Codes) is a database and universal standard for identifying medical laboratory observations. 


Observational Medical Outcomes Partnership (OMOP)

Observational Health Data Sciencesand Informatics(OHDSI)


The Role of the Common Data Model

No single observational data source provides a comprehensive view of the clinical data a patient accumulates while receiving healthcare, and therefore none can be sufficient to meet all expected outcome analysis needs. This explains the need for assessing and analyzing multiple data sources concurrently using a common data standard. This standard is provided by the OMOP Common Data Model (CDM).

단일 관측 데이터는 환자가 의료 서비스를 받는 동안 축적된 임상 데이터에 대한 포괄적인 뷰를 제공하지 않으며, 따라서 모든 분석 요구를 충족하기에 충분하지 않을 수 있다. 표준적인 공통 데이터를 사용하여 복수의 데이터 소스를 동시에 평가하고 분석해야 할 필요성을 설명한다.이 표준은 OMOP 공통 데이터 모델(CDM)에 의해 제공된다.

The CDM is designed to support the conduct of research to identify and evaluate associations between interventions (drug exposure, procedures, healthcare policy changes etc.) and outcomes caused by these interventions (condition occurrences, procedures, drug exposure etc.). Outcomes can be efficacious (benefit) or adverse (safety risk). Often times, specific patient cohorts (e.g., those taking a certain drug or suffering from a certain disease) may be defined for treatments or outcomes, using clinical events (diagnoses, observations, procedures, etc.) that occur in predefined temporal relationships to each other. The CDM, combined with its standardized content (via the Standardized Vocabularies), will ensure that research methods can be systematically applied to produce meaningfully comparable and reproducible results.




Definition and DDLs for the OMOP Common Data Model (CDM) - OHDSI/CommonDataModel



'공부 > 통계학' 카테고리의 다른 글

핸즈온 머신러닝 10. 인공신경망  (0) 2019.08.01
OHDSI publications  (0) 2019.07.18
핸즈 온 머신러닝 8장 PCA 후반부  (0) 2019.07.09
ensemble size and combination operators  (0) 2019.05.15
핵밀도추정 스크랩  (0) 2019.05.15
Posted by 시스메

커널 PCA와 LLE 

'공부 > 통계학' 카테고리의 다른 글

OHDSI publications  (0) 2019.07.18
개인 공부  (0) 2019.07.17
ensemble size and combination operators  (0) 2019.05.15
핵밀도추정 스크랩  (0) 2019.05.15
NNAR 기초  (0) 2019.05.15
Posted by 시스메