레이블이 과학지식인 게시물을 표시합니다. 모든 게시물 표시
레이블이 과학지식인 게시물을 표시합니다. 모든 게시물 표시

[ChatGPT] AI 챗봇의 한계: 허위 정보를 속을만큼 예쁘게 적어서 내보낸다.

ChatGPT 에게 전문 지식에 대해 물어볼 때 조심해야 할 점: 가짜 정보를 마치 사실인 것처럼 이야기한다는 점이다.
 
우선, synaptic pruning이라는 신경생물학 이론에 대해 설명하는 아래 글에 나오는 Dr. Beatrice Golgi는 현실에 존재하지 않는 연구자다. 그리고 신경계에서의 'synaptic pruning (시냅스 가지치기)' 이론은 1990년대에 Dr. Golgi가 아니라 1979년 Peter Huttenlocher에 의해 최초로 나온 이론이다. 

ChatGPT: "The concept of synaptic pruning in humans was first introduced in the 1990s by a group of researchers led by Dr. Beatrice Golgi. In a series of seminal papers, Golgi and her colleagues proposed that the human brain undergoes a process of synapse elimination during development, which leads to the refinement and specialization of neural circuits. This process, which they referred to as "synaptic pruning," was suggested to play an important role in the maturation and optimization of the nervous system."

그리고, 전혀 없는 논문을 마치 존재하는 것처럼 레퍼런스 형식에 맞게 내보내기도 한다. 예를 들어, 

"Can you provide references for the brain-targeting antibodies causing increase of the target proteins in blood level?"

라는 질문을 했을 때, ChatGPT는 총 세 개의 논문을 설명해 주면서 레퍼런스를 doi number (논문의 고유 디지털 ID) 까지 제공해 준다. 하지만, 아래 목록 중 예를 들어 두 번째 2016년 논문은 이 세상에 존재하지 않는 논문이다. 참고로 이 허위 레퍼런스의 제일저자(?)인 Boutajangout은 Tau 및 Abeta를 연구하는 알츠하이머 연구자고, alpha-Synuclein이 관여하는 파킨슨병에 대해 논문을 낸 적은 없다. (물론 레퍼런스 세 개 전부 가짜다.)

• A study by El-Agnaf et al. (2006) looked at the effects of an anti-amyloid beta antibody in a mouse model of Alzheimer's disease. They found that treatment with the antibody led to a significant increase in blood levels of amyloid beta.
• A study by Boutajangout et al. (2016) examined the effects of an anti-alpha-synuclein antibody in a mouse model of Parkinson's disease. They found that treatment with the antibody led to a significant increase in blood levels of alpha-synuclein.
• A study by Kim et al. (2018) investigated the effects of an anti-Tau antibody in a mouse model of tauopathy. They found that treatment with the antibody led to a significant increase in blood levels of Tau.
 
References:
• El-Agnaf OM, Salem SA, Ali MA, et al. Antibodies to beta-amyloid peptide reduce beta-amyloid peptide levels in brain and blood of transgenic mice. J Neurosci. 2006;26(35):8989–8995. doi:10.1523/JNEUROSCI.1591-06.2006
• Boutajangout A, Bousset L, Melki R. Alpha-synuclein antibodies increase blood alpha-synuclein levels in a mouse model of Parkinson disease. Neurobiol Dis. 2016;93:139–145. doi:10.1016/j.nbd.2016.04.006
• Kim J, Lee J, Kim J, et al. Passive immunization with anti-tau antibody reduces tau accumulation and neurodegeneration in a mouse model of tauopathy. Sci Rep. 2018;8(1):10261. Published 2018 Jul 20. doi:10.1038/s41598-018-28489-y

얘네들 AI가 작성한거 구분하려고 일부러 가짜정보를 넣어놨나 싶을 정도로, 안 찾아보면 깜빡 속아넘어갈 만큼 너무 당당하게 훌륭한 문법과 양식으로 가짜 정보를 보기 좋게 늘어놓는다. 

일련의 결과로 인해, ChatGPT는 영어 문법 교정 정도를 넘어서는 용도로 사용하면 위험할 것 같다는 생각이 들었다.

실제로 얼마 전에 구글 챗봇에서도 제임스웹 망원경 관련해서 틀린 정보를 답하는 바람에 망신 당하고 구글 주가도 주르륵 미끄러졌던 적이 있었다. 얘네들도 크게 다르지 않을 것 같다. 학습을 인터넷에서 긁어오는 건 학계의 정설이 아닌 가짜 정보를 걸러내지 못한다는 단점이 있으니깐.

가령 창조쟁이들이 웹이나 유튜브 댓글에 도배질 해놓은걸 공부한 AI챗봇한테 진화생물학 관련 질문을 하면 틀린 답변을 내놓을 거라는걸 쉽게 예상할 수 있지 않겠나.

연구 주제에 따른 연구 방법 설계하기

http://www.ibric.org/myboard/read.php?Board=news&id=304533&Page=1

연구 주제에 따른 연구 방법 설계하기

생물과 또는 의대 대학원에 입학해서 많은 경우 선배나 포닥이 하는 실험 중 일부를 받아다가 그게 뭐하는 건지도 모르고 실험 방법만을 배워서 진행하곤 한다. 하지만 그러면 랩미팅 시간에 대뜸 '그래서 그 실험은 뭣땜에 and/or 뭘 보려고 한건데?'라는 질문에 대답 못하는 경우가 생긴다.

가장 우선적으로, '내가 이렇게 실험을 많이 했다' 하는 것을 보여주기 이전에, 그 많은 실험들을 왜 하는가에 대한 고찰이 필요하리라고 생각한다. 예를 들어서 다음과 같은 사고 과정을 단계 단계별로 진행해 보면 될 것이다. 다만 이러한 과정이 절대적인 것은 아니며, 나름의 과학적 방법론에 입각해서 체계적으로 설득력 있는 가설-검증 과정을 수행할 수 있을 경우 다른 방법을 따르는 것도 좋다.


introduction

(1) 내가 어떠한 현상에 관심을 갖고 있으며, (what is my interest)

(2) 그 중 알려진 부분은 어떤 것이고, (what is known)

(3) 아직 알려져 있지 않은 (내가 궁금한) 점은 어떤 것인지, (what is unknown & where do I focus)


strategy

(4) 알려진 부분으로 미루어 보아 그 궁금한 부분은 무엇 때문일 것이다 하는 나의 가설 (setting up my hypothesis)

(5) 그 궁금한 점을 해결하기 위해서는 어떠한 실험들이 필요한지 (experiments needed)

[부가적] (5-1) 실험이 예상대로 나올 경우의 해석 (my interpretation with expected results)

[부가적] (5-2) 실험이 예상대로 나오지 않을 경우의 대안적 해석 (my (alternative) interpretation with unexpected results)


results

(6) (비슷한 얘기지만) 지금 보여주는 특정 실험은 무엇을 알아보기 위해 하는 것인지, (What do I want to see with this experiment)

(6-1) (부가적으로) 실험 방법에 대한 간단한 소개 (short introduction for the method)

(7) 결과는 어떻게 나왔는지, (what's the result)

(8) >for "results" if "I have more" then goto (6) else goto (9)


discussion

(9) 이 실험들이 내 가설의 전체 맥락에서 어느 부분을 설명하는지,(what do these experiments explains about my hypothesis) 그리고 내가 알아보고자 하는 점(가설)을 이 실험 결과가 충분히 설명했는지 여부 (if this experiment is enough to explain my hypothesis)

(10) 추가 & 반복실험 필요 여부 및 진행상황 (further studies (if needed) & current progress)

[신경 쓰이는 생물학 이야기] 신경 쓰이는 작업도구(2): 논문 쓸 때 레퍼런스 정리는 멘델레이 (Mendeley)로 해보자.

지난 글에서는 논문 작성의 필수품인 마이크로소프트 오피스의 구독형 버전인 MS Office365를 교육기관 소속이면 무료로 사용할 수 있다는 점에 대해 알아보았다. (참조: 신경 쓰이는 작업도구(1): 원생 및 포닥의 MS Office 365) 이번 글에서는 MS Word를 사용해서 논문을 작성할 때 매우 편리하게 사용할 수 있는 보조 프로그램을 소개하고자 한다. 논문 쓸 때 레퍼런스 정리는 어떻게들 할까? 학교 계약을 통해서 교내에서 유료 서지관리 프로그램인 EndNote를 설치해서 쓸 수 있으면 다행이다. 다만 학교마다 서로 다른 곳들과 계약이 되어 있기 때문에 어디서는 Refworks 어디서는 EndNote 대략 이런 식으로 따로따로 쓰고 있다. 여기서 필자가 소개하고자 하는 프로그램은, 어디서나 누구나 무료로 사용 가능한 멘델레이(Mendeley)라는 프로그램이다. 멘델레이는 2013년에 소위 ‘출판 공룡’이라 불리는 엘제비어(Elsevier)에 인수되어 현재에 이르고 있고, 비교적 넉넉한 2GB의 온라인 PDF 저장 공간을 제공하고 있다. 대체로 클라우드 중심의 인터페이스로 운영되고 있기에 여러 기기에서 동기화를 하기가 용이한 편이다. (브릭에서 계속 읽기)

[신경 쓰이는 생물학 이야기] 신경 쓰이는 작업도구(1): 원생 및 포닥의 MS Office 365 – MS OneDrive 1TB 공짜(!)로 써먹기

흥미로운 생물학 연구 관련 포스팅들도 재미있었지만, 지난 번 포스팅의 반응을 보니 그 이외의 관련 주제들에 대해서도 다루어 보는 것이 어떨까 해서 당분간 주제의 방향을 좀 “(연구자 한정) 생활 밀착형”에 가깝게 살짝 바꿔 보고자 한다. 관련하여 독자 여러분의 많은 의견 부탁한다.

무릇 인간은 ‘도구를 쓰는 동물’이라고 하였다. (Homo Faber – by 앙리 베르그손) 그렇다면 대학원생 또는 포스닥 연구원으로서 파이펫 빼고 우리가 가장 많이 사용하는 도구는 무엇일까? 바로 컴퓨터일 것이다. 그 중 우리가 이미징 분석이나 시퀀싱 결과 등의 분석이나 계산 작업을 빼고서 가장 많이 사용하는 용도는 무엇일까? 문서 작성 및 발표자료 준비가 아닐까 생각한다. 그러면 전 세계적으로 이러한 목적으로 사용하는 프로그램은 무엇을 가장 많이 사용할까? 바로 마이크로소프트의 오피스 프로그램일 것이다. 물론 토종 오피스인 한컴오피스 아래한글이 국내에서는 30퍼센트 정도 점유하고 있지만, 그것 역시 공공기관에서의 강제적인 사용 때문이라 우리 같은 파이펫쟁이들은 대부분 MS Office의 지배 하에 있다고 해도 과언이 아닐 것이다.



그림 1. 점점 확고해지는 마이크로소프트 왕국의 지구정복. (출처: Okta.com의 ‘Business at work 2019 report’. 이건 심지어 오피스 뿐 아니라 모든 프로그램(!)을 통틀어서 수집한 결과임.)
 
특히 MS Office 365의 경우 클라우드 싱크를 강조한 제품인데, 정기구독 개념으로 구매를 하게 되어 현재 시세로 대략 1년에 9만원~12만원 정도의 요금을 내게 된다. 하지만, 마이크로소프트는 “아직도 배가 고픈” 것인지, 예비 사용자들을 대상으로 일찍부터 점유율을 올려 놓고서 이후의 유료 사용자를 늘리기 위한 일환으로 (일단 필자의 생각이다.) 학생 및 교직원(교사 포닥 연구원 교수 포함)들에게 무료로 배포중이다. (전체 읽기 클릭)

신경 쓰이는 아무말: 나 자신의 진로적성은 무엇일까?

이제 와서 느낀 점인데, 지금의 내가 가장 잘 할 줄 아는 것은 업무상 편리한 작업 도구 (또는 프로그램) 를 찾아내어 다른 이들에게 소개하고 사용법을 가르쳐 주는 것이 아닐까 싶다.

석사과정 때는 그냥 처음 써보는 실험방법이나 문서작성법 등을 배우기 급급해서 별게 없었던 것 같다. 다만 이때부터 SPSS를 처음 배워보거나 노트북을 사용한 문서 작성에 재미를 붙이거나 하는 등의 기반 다지기 시절이었던 것 같다.

박사과정 때도 그런게 잘 드러나진 않았다. 다만 교수가 biased random walk에 꽂혀서 모든 결과를 그 관점에서 보는 바람에 논문 연속 리젝만 열 번 가까이 먹었는데, 결국 게재승인된 논문에는 내가 졸업논문에 진화론에 빗대어 쓴 개념 설명을 (random vs determination 사이의 상호관계 등) 상당 부분 차용했다. (그래서 거기 내 데이터 별로 없어도 코퍼스트 넣어줬겠지...)

그리고 image analysis 할때 현미경에 딸려온 유료 프로그램을 써서 수동으로(...) 배경 찍고 형광시그널 찍어서 백그라운드 노이즈 노멀리제이션 하고 있길래 ImageJ의 subtract background 기능을 찾아서 알려주고 나도 잘 써먹었다. 세포표면의 receptor asymmetry 측정을 위해서는 oval profile이라는 (더이상 업데이트 안돼서 ImageJ도 구형 버전으로 써야하는...ㅠㅠ) 플러그인을 찾아서 자동으로 방향성을 측정할 수 있었기에 (이때 샘플 n수가 그룹당 적게는 100개, 많게는 300개 이상이었다. 쥐가 아니라 벌레-예쁜꼬마선충-라서 할 수 있는 숫자임) 졸업논문용 데이터 쌓아올리는 데 유용하게 썼다.

(...생각보다 많네? 그런데 요때는 거의 나혼자 써먹을 용도였다는거...)

포닥1 때는 랩원들이 다들 적절한 그래프 디스플레이 방법이 없어서 헤메고 있었을 때 내가 GraphPad Prism을 써보기를 제안했고, 그래프 때문에 고생하던 학생의 문제가 싹 사라졌다. 써보면 쓰기 쉬우니깐. 그리고 R 배울 것을 추천해서 그 학생은 R을 제대로 학교 수업에서 배웠다. 결국 우수한 학생으로 크고 있는 것 같다. (그런데 나는 배운적 없어서 할 줄 모른다는게 함정.ㄷㄷㄷ)

연구교수 때는 내가 제안한 것들 중에 카카오 아지트가 채택되어 시험적으로 운용되었다. 그때까지 이메일로만 오갔던 학생-교수 사이의 디스커젼이 온라인 상에서 거의 실시간으로 이루어지는 것을 보았다. 말하자면 실험실 운용의 사이버 인프라를 제공했던 셈이었다.

현재 다시 포닥2 오면서는 원드라이브와 오피스365를 추천했다. 논문 작성하면서 실시간으로 교수의 피칠갑(...)이 시작되었고, 논문 필진 중 학생 한 명은 라이팅에 실질적으로 많은 도움이 되었다고 했다. 그 학생에게는 멘델레이 사용법도 살짝 가르쳐 주었는데, 이전까지의 매뉴얼 타이핑에 비해 엄청 쉽다며 신나게 써먹고 있다.

...이런 사실로 미루어, 내가 갈만한 다음 직장은 어떤게 좋을까. (충분한 연봉과, 직업적 안정성 또는 성장성이 있어야 한다.) 연구성과(=논문)에 관계 없이 갈만한 좋은 곳이 있을까?

[신경 쓰이는 생물학 이야기] 신경 쓰이는 아무말: 바이오 PhD의 진로에 대하여




바이오 전공 박사로서 갈 수 있는 직종은 생각보다 많았다. 그 무엇도 쉬운 길은 없지만. ​​​(출처: 위키백과 영문판)

오늘은 지금까지의 바이오 뉴스 소개하는 글과는 좀 다른 성격의 이야기를 해보고자 한다. 바로 명절날 친척 모임에서 “너 박사 졸업하고 나면 or 포닥 하고 나면 이제 뭐할건데?”에서 뭐할건데(…)를 맡고 있는 바이오 PhD의 진로에 대한 이야기다.

지금까지 살아온 여정을 되돌아보고 있노라면, 그리 성공적인 인생을 살아오지 못한 데 대한 아쉬움이 크다. 처음 이 분야에 대한 공부를 시작하겠다는 결심부터 그저 고3때 뭔가 미래가 있어 보인다는 다소 가벼운 마음으로 심각한 고민 없이 결정했던 것이 아닐까. 이왕 지금까지 저질러 왔던 것이 있으니 처음 전공을 정하던 시절로 되돌아갈 수도 없고 해서, 지금 시점에서 내가 나아갈 만한 진로에는 뭐가 있는지에 대해 여러 가지 옵션들을 알아보고자 한다. 예상보다 많은 길이 있었으나, 뭐든 쉽지는 않고 충분한 준비가 필요한 것 같다. 일단 지금까지 내가 알아봤던 진로들에 대해 간단히 정리해서 적어 보고자 한다. 이밖에도 여러 가지 진로가 있을 수 있으니 내가 놓친 부분이 있다면 독자 여러분께서 덧붙여 주시면 감사하겠다. 아무래도 직접보다는 간접 경험이 많아 틀린 부분에 대한 지적도 해주시면 감사하겠다.

1. 전형적인 길 (1): 아카데믹 테뉴어 트랙

말할 것도 없이 대부분의 대학원생들이 이미 알고 있는 길이다. 학부-석사-박사-포닥-연구교수-조교수-부교수-정교수로 일직선의 엘리트 코스. 문제는 이런 길을 갈 수 있는 사람은 전체의 1% 될까 말까 하다는 점이다. 굳이 이 길을 가고자 한다면, 현재의 내 연구능력이나 위치로 따져볼 때 나랑 같은 건물에서 맨날 마주치는 같은 과 대학원생들 선후배 포함해서 한 트럭 가득 데려다 놔도 내가 그들보다 낫다는 확신이 서야 한다.

장점: 가장 전형적인 진로이며, 옆길로 새지 않고 한길만 파는 진로의 정점이랄 수 있겠다.

단점: 절대 다수가 나이 많은 비정규직 연구교수 또는 포닥으로 늙어간다. 필자는 현재 여기 엮여 있는데, 탈출을 위해 버둥거리는 중이다.  (전체 읽기 클릭)

[신경 쓰이는 생물학 이야기] 마늘을 먹으면, 노화로 인한 기억력 감퇴를 막아 줄까?

(흥미로운 주제의 뉴스를 발견했는데, 최근 열린 미국 생리학회에서 발표된 포스터 하나를 요약한 뉴스들만 있고 해당 연구에 대해 출판된 논문은 없기에 그냥 그 뉴스를 번역해 보았다. 내 나름의 언어로 요약-정리한 것이 아니라 영어 원본을 그대로 한국어로 옮긴 것이기 때문에 문체는 좀 딱딱할 수 있다.)

요약:  마늘에는 황화알릴 성분이 있어서 이를 섭취하면 장내 필수 박테리아를 복원시킴으로써 기억 및 인지능력을 증진시켜 준다. 
(출처: 미국 생리학회의 2019년 실험생물학 학술대회)


최근의 실험용 생쥐를 이용한 연구 결과에 의하면, 노화로 인한 장내 미생물균총 변화가 기억력 감퇴와 연관되어 있는데, 마늘을 섭취할 경우 이를 되돌릴 수 있다고 한다. 이러한 유익한 효과는 건강에 좋다고 알려져 있는 마늘에 포함된 황화알릴이라는 성분에 의한 것이다. (전체 읽기 클릭)

[신경 쓰이는 생물학 이야기] 심리학: 목적론적 세계관은 창조론과 음모론을 부른다.


그림 1. 미국 1달러 지폐. 뒷면 왼쪽의 피라미드가 13층이라서 적그리스도를 상징하고 그 피라미드 꼭대기의 전시안(Eye of Providence)이 프리메이슨 휘장의 눈 모양이라는 음모론의 단골 소재로 쓰이고 있다.

이번 시간에는, 하드 사이언스는 아니지만 나름 흥미로운 주제의 심리학 연구결과를 하나 소개하고자 한다.

자연이나 사회에서 일어나는 특정 사건이나 현상에 "어떠한 근본적 원인이나 목적이 존재할 것"이라는 믿음은 인지적 편향성을 만들어 낸다. 이러한 편향성은 목적론적 세계관을 이루며, 언뜻 보기에 별로 상관없어 보이는 "음모론(conspiracism)"과 "창조론(creationism)"이라는 두 가지 신념과 관련이 있다고 한다. 독특하게도 이를 연구한 짤막한 심리학 논문이 2018년 8월 20일자 Current Biology 라는 제법 괜찮은 생물학 저널에 오픈 액세스로 게재되었다1. (계속 읽기)

[신경 쓰이는 생물학 이야기] 각막 상피 손상 및 회복에 관한 미국 연구과제 엿보기



이번 시간에는 미국 국립 보건원에서 한국의 중견 과학자 연구과제에 해당하는 R01 grant를 다년간 수주한 연구 프로젝트 하나를 소개하고자 한다. 내용 자체가 전반적으로 좀 딱딱할 수 있지만, 미국의 중견급 과학자들이 어떤 식으로 가설을 세우고, 또 어떤 식으로 이를 검증할 연구를 기획하는지 살짝 엿보고자 한다.

주제는 손상된 말초신경의 회복 기전이며, 좀 더 구체적으로는 재발성 각막 상피 미란 발생 기전 및 회복 연구이다. 딱히 내가 아침마다 라섹수술받은 눈이 뻑뻑하고 따가워서 매일매일 인공누액 넣어야 하는게 귀찮아서 이런거 찾아본 건 아니다(...ㅠㅠ). (계속 읽기)


[신경 쓰이는 생물학 이야기] 예비실험: 건강한 젊은이가 ADHD 약을 먹으면 오히려 머리 나빠진다.


요즘 들어, 원하는 성적이 나오지 않는 아이들의 부모들 중에 ‘혹시 내 아이가 ADHD(주의력 결핍 과잉 행동 장애)가 아닐까?’ 하는 걱정들을 많이 한다. 심지어 막무가내로 의사를 찾아가서 ‘내 아이가 ADHD인 것 같으니 집중하게 하는 약을 처방해 달라’고 하는 분들에 대한 사례도 있다고 한다. 주로 처방되는 약은 콘서타(메틸페니데이트) 또는 애더럴(암페타민) 등의 마약성 각성제이며, 최근 10여 년 동안 미국의 20-30대 여성을 중심으로 5-7배 이상 처방이 급증했으며, 한국에서도 매년 수능 시즌 즈음마다 비정상적으로 처방 건수가 늘어나 국정감사 등에서 문제가 제기되고 있다.
미국 로드 아일랜드 대학 및 브라운 대학의 합동 연구가 최근 (2018년 6월 27일) Pharmacy 저널에 발표되었는데, 일반적인 대중들의 믿음(미신?)과는 정 반대로, ADHD 치료약은 건강한 학생들의 인지능력을 전혀 향상시키지 못했으며, 오히려 저해한다는 결과를 보여주었다. 사실 연구팀은 주요 ADHD 치료제 중 하나인 애더럴이 인지 능력을 향상시킬 것이라 예측했으나, 실제로 나온 결과는 독서 이해 및 유창함 향상에는 아무런 영향이 없었는데다가 작용기억(working memory)은 오히려 저해하였다. (계속 읽기)


[신경 쓰이는 생물학 이야기] 삼대 영양소(단백질, 지방, 탄수화물) 중 살찌는 건 오직 지방 때문이라고?

그림. Graphic Abstract [Hu et al., Dietary Fat, but Not Protein or Carbohydrate, Regulates Energy Intake and Causes Adiposity in Mice, Cell Metabolism (2018), https://doi.org/10.1016/j.cmet.2018.06.010. in press.]

다이어트에 대한 현재의 통념은, “단백질은 살 빼는 데 좋고, 탄수화물은 나쁘다. 지방은 별 영향 없다.” 정도로 요약될 수 있다. 특히 보디빌딩 하는 사람들의 경우 체지방을 빼기 위해 탄수화물을 제거한 극단적인 고단백 식단을 짜는 일이 흔하다. 그런데 최근 Cell Metabolism에 발표된 논문에 따르자면 또 그런 것만도 아닌 것 같다. (계속 읽기)



"성정체성은 유전되는가?"




원문: "Is Transgender Identity Inherited?" - by Ricki Lewis, PhD

"트랜스젠더의 성정체성은 유전에 의한 것인가?"
관련하여 이 글의 저자 Ricki Lewis는 David Reimer (1965-2004)의 예시를 소개한다. David은 어릴적 실패한 포경수술로 인해 음경을 잘라내야 했고, 이후 부모에 의해 여자아이로 길러진다. 그러나 그는 항상 자신의 정체성을 남성으로 인식하고 있었고, 14세가 되자 자신의 '남성성'을 되돌릴 외과적 방법을 찾게 된다.

Ricki는 트랜스젠더 작가 Jennifer Boylan 과의 만남 이후 자신의 유전학 교과서에 트랜스젠더에 대한 내용을 싣기 시작한다.

"트랜스젠더는 성 정체성과 연관된 상태이며 (그 기전이) 잘 알려지지 않았다. 트랜스젠더 개인은 특정 성별의 외형과 성염색체를 갖고 있으나 극단적으로 반대의 성별 정체성을 갖고 있다. 이는 transvestitism 즉 남성이 여성의 옷을 입는 것을 선호하는 것보다 훨씬 근본적인 상태이다. 트랜스젠더의 유전적 또는 물리적 원인은 알려져 있지 않다. 그들 중 일부는 자신들의 물리적 성별과 존재적 성별을 일치시키기 위해 외과적 시술을 가하기도 한다."

초기 판본들에서는 편집인이 이 문단은 유전학과 관계가 없으므로 삭제하라는 요구를 했다고 한다. Ricki는 거부했지만.

이어 저자는 성별 형성과 관련된 연구결과를 소개하는데, 그중 흥미로운 것으로는 소위 "guevedoces" 즉 "열 두 살의 페니스"라고 하는 "제 3의 성"이다. 근친혼이 성행했던 도미니카공화국에 흔히 있는 유전형인데 5-alpha reductase 결핍으로 인하여 태어날 때는 여자아이로 태어나고 외생식기 또한 여성의 형태를 띠지만 내부는 남성의 구조를 갖고 있다. 그런 아이가 사춘기에 이르게 되면 테스토스테론 분비가 시작되면서 음핵이 길어져 음경이 되고 정자가 생성되며 대부분 수정이 가능한 남성으로 바뀌게 된다. 도미니카공화국에서 guevedoces들은 자연스러운 정체성 중 하나로 받아들여지고 있었다고 한다.

"트랜스젠더에 대한 GWAS (Genome-Wide Association Study)로 언젠가는 트랜스젠더의 유전적 특성이 밝혀질 수도 있다. 그런데 우리가 꼭 거기까지 갈 것도 없이, 트랜스젠더 본인들이 이미 자신들에 대해 잘 알고 있다. 부모로서 딸이 자신을 남자로, 아들이 자신을 여자로 생각한다면? 그냥 기다리고 보아주며, (뭘 억지로 바꾸려 말고) 있는 그대로 두면 된다."

생물 실험에서 재현성을 얻기 위해 필요한 반복 실험 횟수는?

실험을 할 때 biological replication, 즉 "새로 sample prep 해서 실험한 다음 결과 측정하기" 전과정을 몇 번 반복해야 실제로 통계적 유의성을 보여주는 결과를 얻을 수 있을까요? 특히 RNA-sequencing에 대한 실험을 수행할 경우, 최소 몇 번을 반복해야 reproducibility issue에 걸리지 않고서 과학적으로 의미있는 결과를 얻는 것이 가능할까요?
이에 대한 실험을 영국의 University of Dundee 에서 총 48회의 RNA-sequencing 반복 실험과 총 11가지의 분석 방법을 통해 확인해 보았는데요, 결론부터 말씀드리자면 최소한 20회 이상의 biological replication을 해야 최소 85% 이상의 모집단 일치율을 보여줄 수 있다고 합니다. 그리고 모든 경우에서 false posive는 5% 미만으로 나왔습니다.
그리고 통상적으로 많이들 하는 3회 반복 실험의 경우 일치율이 20-40%에 불과하며, 따라서 과학적으로 믿을 수 없는 데이터입니다.
이 논문에서 권장하기로는, 
(1) 모든 실험에서 조건당 최소 6회 반복, 
(2) Significant Differential Expression을 보이는 gene들이 대부분 중요한 gene들일 경우는 조건당 최소 12회 반복, 
(3) 반복 횟수 12회 미만일 경우에는 edgeR(exact) 또는 DESeq2 분석툴 권장, 
(4) 12회 이상 반복할 경우 DESeq 분석툴 권장, 
(5) True positive와 False negative를 구분하기 위한 fold-change threshold는 0.1≤T≤0.5 사이
...를 권장합니다.
"How many biological replicates are needed in an RNA-seq experiment and which differential expression tool should you use?"

Schurch, N.J., Schofield, P., Gierliński, M., Cole, C., Sherstnev, A., Singh, V., Wrobel, N., Gharbi, K., Simpson, G.G., Owen-Hughes, T., et al. (2016). How many biological replicates are needed in an RNA-seq experiment and which differential expression tool should you use? RNA 22, 839–851.

표본 크기(n값) 산출의 중요성.

P-Values
image from: xkcd.com

조금 전, 학교 전산실에서 "통계 표본크기 산출" 주제의 세미나를 듣고 왔다.

???: "요즘 high IF journal에 논문 섭미션할때 그냥 p-value만 들이대면 리뷰오고 통계로 까이고 그러면 리젝받고. 그러면서도 리뷰어에게 허벌나게 치욕적 비난받고 낮은 IF 저널에 냅니다. 온코타겟을 살"(...)

결국 관건은, 통계 검정력을 위한 표본 숫자를 정확하게 계산해서 제시해야 논문 피어 리뷰어도 납득할거라는 얘기인듯 하다. 최근 들어 의학 및 심리학 논문들에서 재현성 위기 (https://en.wikipedia.org/wiki/Replication_crisis) 때문에 엄청 난리였는데, 잘못된 통계 검증 때문에 연구 자체의 유의성이 잘못 설정되어 실제로 그 연구들을 다시 수행해 보았을 경우 재현성이 나오지 않는 경우가 엄청 많았다고 한다. 특히 생물학의 경우 조사 대상의 약 80% 가까이 다른 논문의 방법을 따라했을 경우 결과 재현에 실패한 경험이 있고, 약 60%의 연구자는 심지어 본인의 실험 재현에도 실패한 적이 있다고 하더라(...).

그 이유로 생각해볼 만한 것이, 통계적 연관성이 인과성을 대표하지 않기 때문에 외부 조건에 따라 다른 결과가 나올 경우도 있겠지만, 많은 경우 통계적 계산을 잘못 적용하거나 너무 약한 통계검정을 사용하여 잘못된 통계치를 근거로 유의성을 주장했기 때문인 것으로 보인다.

그래서 요즘같은 경우에는 p-value (귀무가설이 참일 경우에도 이를 기각하는 결과가 나타날 확률) 만으로는 부족하고, 통계적 검정력 및 그에 입각한 표본 갯수 설정 과정도 요구하는 저널이 많아지고 있다. 앞으로 이에 대해 많이 공부해야 할듯 하다.

[Sample size 결정을 위한 effect size 결정]

Cohen's d : 표준화된 효과크기=실제 효과크기/표준편차
<0.4: 작은 효과크기
0.4-0.7: 중간 효과크기
>0.7: 큰 효과크기

여기서 G-Power 라는 프로그램이 실험군당 표본 수 결정을 계산하는 데 도움이 된다고 한다. (https://en.wikipedia.org/wiki/G*Power)

참고:
https://cs.kaist.ac.kr/colloquium/files/20161031.pdf

[파토의 과학하고 앉아있네] SPBC 뉴스룸 - 전염병과 사이버스페이스 (이용의 집착분석, 2017.08.10)

팟빵 링크(54분부터)

와우(WOW; 월드 오브 워크래프트), 나는 게임을 안해서 이름만 들어봤는데, 와우 초창기에 새로 생긴 '줄구룹' 던전의 보스 캐릭터 '혈신 학카르'가 사용하는 감염성 저주(오염된 피)가 마치 실제 현실에서의 전염병처럼 퍼져나갔던 현상에 대한 이야기를 포함한, 사이버스페이스에서의 인간군상에 대한 이야기를 '과학 하고 앉아있네'에서 다루고 있어 공유하고자 한다. 워낙 흥미로운 현상인지라 다수의 역학(epidemiology) 연구자들이 분석하여 논문으로 내기도 하였다.

"과학 기술의 윤리: 과학자의 윤리에서 첨단 기술의 윤리로(이덕환 교수)" - 네이버 열린연단 강연 시리즈

네이버 열린연단 강연 시리즈 중에 2016년 12월 10일에 있었던 "과학 기술의 윤리"라는 제목의 강연+토론인데, 그중 1부: 서강대학교 화학과 & 과학커뮤니케이션 전공 이덕환 교수의 강연이다. 근데 듣다 보니 내용이 꿀잼이다. ㅋㅋ

한국 과학 발전의 역사를 짚어가면서, 유명한 2005년의 '황우석 사태'에 대한 이야기도 중요하게 다루고 있고, 그밖에 한국인 과학자들이 왜 돈만 처먹고 노벨상 못타고 찌질하냐고 비난 많이 받는데, 전국가적인 투자는 기술개발 쪽에 잔뜩 해놓았는데 정작 노벨상은 기술개발의 성과가 아니라 기초과학의 지식을 세운 사람들에게 주는 상이었다는 얘기도 있다. 본인이 과학 전공자라면 이 강연 한 번쯤 시간 내서 각잡고 시청하길 권한다. 꼭 봐라. 두 번 봐라. ㅋ

============

"과학과 문화: 문화에 있어서의 과학의 위상 (오세정 교수)" - 네이버 열린연단 강연 시리즈


네이버에서 카오스재단과 공동으로 강연회 시리즈를 기획하여 진행하고 있는데, 그중 
이 강연이전에 소개한 앨런 소칼의 소위 '지적 사기'와도 관련이 있는 내용이라 흥미롭다. 서울대학교 물리천문학부 오세정 교수가 강연을 진행하며, 96년도에 벌어졌던 포스트모던 과학지식사회학에 대한 물리학자 앨런 소칼의 가짜논문 사건을 다루고 있다. 당시 이에 관려하여 오세정교수가 참여한 언론 지면상의 토론이 있었으며, 그에 대한 오세정 교수의 자세한 부가 설명도 들을 수 있다. 이후 토론 파트에서는 서울대학교 생명과학부 홍성욱 교수(과학사 및 과학철학 전공)와 카이스트 물리학과 정하웅 교수가 참여하고 있다.

============
과학과 문화: 문화에 있어서의 과학의 위상


오세정 서울대 물리천문학부 교수는 "그 동안 과학은 주로 '경제 발전을 위한 도구'라는 인식이 강했다"고 전제한 뒤 "미래만이 아니라 현재 우리가 부딪히는 사회의 많은 문제들도 과학기술적 요소를 포함하고" 있는 상황에서, 그 어느 때보다 "올바른 과학 정신에 대해 교육하는 일"이 중요한데 "특히 구체적인 과학적 지식을 많이 가르치는 것보다는 과학 지식이 객관적으로 얻어지는 과정과 그 사고방식을 가르치는 것이 더욱 중요하다"라고 강조했다. 그와 동시에 "과학자들이 인문학적 지식을 갖는 것도 더욱 절실해질 것"이라고 말했다.

지적 사기: 물리학자 앨런 소칼이 포스트모더니즘을 놀려먹은 사건





위는 앨런 소칼의 소위 '지적 사기 사건'에 대해 작가 클리포드 골드스타인이 설명해주는 동영상이다. (참고: 위키백과)

90년대 초중반, 과학지식에 대한 포스트모던적 사회구성주의가 철학계에서 유행하여 인지의 불완전함에 따르는 지식의 상대성을 앞세워 과학 지식 또한 사회적 구성에 따른 상대적 지식이라는 주장이 대두되어 현실의 객관적 실체를 인정하는 실재론자들 및 방법론적 자연주의를 따르는 과학자들과의 논쟁이 점점 격해지고 있었다.

당시 포스트모던 사회구성주의 철학 저널인 [Social Text]에서 과감하게 피어 리뷰를 생략하고 이 주제를 다룬 "과학 전쟁" 특별편을 준비하고 있었는데, 거기에 앨런 소칼이 포스트모더니즘적인 용어를 사용해서 포스트모더니즘을 편들어주는 척 아무말 대잔치를 해놓은 가짜논문을 제출해서 게재된 뒤, [Lingua Franca]라는 다른 저널에서 이를 폭로한다.

이 일로 [Social Text]지는 1996년에 이그노벨 문학상을 수상하게 된다. 참고로 이그노벨상은 노벨상 패러디 목적으로 "흉내낼 수 없거나 흉내내서는 안되는" 업적에 수여하는 상이다. 작년 상금은 10조 짐바브웨 달러이며 미국 달러로 환산하면 약 4달러 정도 된다.
"LITERATURE: The editors of the journal Social Text, for eagerly publishing research that they could not understand, that the author said was meaningless, and which claimed that reality does not exist. (문학상: Social Text 저널의 편집인은, 실재는 존재하지 않는다고 주장한, 저자 본인이 아무 의미 없다고 말한, (편집인) 본인이 이해도 못한 연구를 기꺼이 출판하였기에 이 상을 수여함)"

"과학 이론"으로서의 진화론의 의미



흔히 "진화론은 단지 이론일 뿐 증명된 법칙이 아니다"라는 주장을 하는 경우가 많은데, 이는 (1) 실생활에서 사용되는 "이론" 즉 "그냥 떠올린 생각"과 "정립된 과학 이론"의 차이, 그리고 (2) "과학 이론"과 "자연 법칙"의 차이를 잘 몰라서 생기는 오해라고 볼 수 있다.

다시 말해 실생활에서 쓰이는 "이론적으로야 그렇지"라는 말과, "정립된 과학 이론(정설)"은 동일한 단어를 쓰지만 그 의미는 꽤 다르다. 이 용어상의 괴리를 이용하여 "과학 이론 또한 완벽하지 않으므로 불변의 진리가 아니다"라는 말로써 진화론을 반증하려는 시도들을 한다.
그러나 "과학 이론"은 그런 얄팍한 꼼수로 반증되는게 아니다. 과학적 방법론은 현상에 대한 관찰-법칙 발견 및 정리-가설 설정-가설에 대한 검증 수행-검증된 가설로써 이론 만들기의 단계를 거쳐 과학 이론을 만들어낸다.

이렇게 만들어진 이론은 대개의 경우 동료평가를 거쳐 논문으로써 발표되어 전문가들에게 공개적으로 검증을 받게 된다. 이 모든 단계를 다 거쳐야 하나의 정립된 "과학 이론"이 만들어지며, 다양한 시각에서의 접근법을 통해서도 이 이론이 지지되며 반증에 대한 방어에 성공할 경우 이 과학 이론은 타당성을 더해간다.

"진화"는 관찰된 자연 현상이며 팩트이다. 이러한 관찰된 팩트가 어떻게 만들어지는지에 대한 과학 이론이 바로 "진화론"이다.

[ChatGPT] AI 챗봇의 한계: 허위 정보를 속을만큼 예쁘게 적어서 내보낸다.

ChatGPT 에게 전문 지식에 대해 물어볼 때 조심해야 할 점: 가짜 정보를 마치 사실인 것처럼 이야기한다는 점이다.   우선, synaptic pruning이라는 신경생물학 이론에 대해 설명하는 아래 글에 나오는 Dr. Beatrice Golgi는...