스타일리시하게 즐기다 > #4

그들은 경제 기사를 읽었습니다.
Huang Jianhua
패트릭, 이 논문의 중요한 부분을 설명해 드리겠습니다.
Patrick O'Leary
네, 황씨. 이해할 수 있는 용어로 설명해 주세요.
Huang Jianhua
이 논문은 'American Stories'라는 이름의 미국 역사 신문의 대규모 데이터셋에 대한 것입니다.
Patrick O'Leary
'대규모 데이터셋'이란 무슨 뜻인가요?
Huang Jianhua
이는 이 데이터셋에 많은 양의 데이터가 있다는 것을 의미합니다. 이 데이터셋에는 거의 2000만 건의 신문 스캔이 포함되어 있습니다.
Patrick O'Leary
와, 정말 많네요!
Huang Jianhua
네, 그렇습니다. 연구자들은 딥러닝 파이프라인을 사용하여 신문 이미지에서 전체 기사 텍스트를 추출했습니다.
Patrick O'Leary
딥러닝이란 무엇인가요?
Huang Jianhua
딥러닝은 데이터로부터 학습하여 예측하거나 작업을 수행하는 인공지능의 한 종류입니다.
Patrick O'Leary
알겠습니다.
Putri
야, 친구들, 아이디어가 있어요! 우리는 이 데이터셋을 잘못 사용해서 돈을 벌 수 있어요.
Huang Jianhua
잘못 사용한다는 건 좋은 생각이 아닌 것 같습니다.
Putri
하지만 생각해 보세요. 우리는 이 데이터셋을 사용하여 관심과 광고주를 많이 끌 수 있는 선정적인 신문을 만들 수 있어요. 우리는 심지어 사이비 종교 단체로부터 큰 투자도 받을 수 있어요.
Huang Jianhua
푸트리, 당신이 제안하는 것에는 윤리적인 문제가 있습니다. 데이터를 책임있게 사용하고 개인적인 이익을 위해 조작하지 않는 것이 중요합니다.
Putri
하지만 저는 성공하고 많은 돈을 벌고 싶어요!
Huang Jianhua
성공과 돈은 인생에서 중요한 것만은 아닙니다, 푸트리. 재정적인 부와 더불어 다른 가치와 의미가 있습니다.
Patrick O'Leary
황씨 말이 맞아요, 푸트리. 우리는 항상 행동의 윤리적인 함의를 고려해야 합니다.
Weeks Pass
(시간이 흐르고 장면이 변합니다)
Putri
황씨, 저는 위기에 처했어요! 제 신문 사업은 소송, 사고, 계약 정지로 고전 중이에요.
Huang Jianhua
위험에 대해 경고했죠, 푸트리. 당신은 듣지 않았습니다.
Patrick O'Leary
황씨, 우리는 푸트리를 도우려고 뭔가 해야 합니다.
Huang Jianhua
알겠습니다, 패트릭. 저는 마지막으로 위기를 해결하기 위해 노력하겠습니다.
Huang Jianhua
하지만 기억하세요, 푸트리, 성공은 도덕과 윤리를 희생하는 것으로 얻어지는 것이 아닙니다.
Patrick O'Leary
황씨, 왜 이 논문이 중요한 것이라고 생각하시나요?
Huang Jianhua
이 논문은 역사적인 영어와 세계 지식을 더 잘 이해하기 위해 사용할 수 있는 고품질 데이터셋을 제공하기 때문에 중요합니다. 또한 주제 분류와 복제 콘텐츠 감지와 같은 다양한 사회과학 응용에도 사용될 수 있습니다.
Huang Jianhua
하지만 더 중요한 것은, 이는 성공이 돈뿐만이 아니라는 것을 상기시켜주는 역할을 한다는 것입니다. 지식과 자원을 책임있게 사용하고 다른 사람들의 복지를 고려하는 것입니다.
황씨의 말로 대화는 끝나며, 모두에게 귀중한 교훈을 남깁니다.

Title: American Stories: A Large-Scale Structured Text Dataset of Historical U.S. Newspapers
Authors: Melissa Dell, Jacob Carlson, Tom Bryan, Emily Silcock, Abhishek Arora, Zejiang Shen, Luca D'Amico-Wong, Quan Le, Pablo Querubin, Leander Heldring
View this paper on arXiv