본고에서는 재범의 위험성 예측을 비롯한 공공영역에서의 위험성 예측 도구를 중심으로 살펴보기로 한다. 국내에서는 이런 알고리즘의 도입이나 사용이 아직 본격화되지 않았지만, 본격적 도입 이전에 인공지능 알고리즘에 의한 위험성 예측이 가지는 여러 가지 문제점 등에 대하여 선제적으로 검토할 필요가 있다. 민간 영역의 법률 서비스에 쓰이는 인공지능 알고리즘은 변호사 등 법률 전문가의 의사결정을 대체한다기보다는 변호사를 보조하고, 변호사의 능력을 증강하는 역할을 하고 있는데 그쳐 공공영역의 인공지능 사용보다는 법적 논쟁거리가 적기 때문에 본고에서 제대로 다루지 않고, 주로 형사절차에서 쓰이는 재범의 위험성 예측 알고리즘과 예측 치안 알고리즘을 중심으로 논한다. 범죄자가 다시 법을 위반할 가능성, 즉 재범의 위험성을 측정하려는 도구는 1930년대에 가석방될 수감자를 결정하기 위해 처음 사용되었다가 점차 선고 시 형량 결정 등에 이르기까지 사용이 확대되고 있다. 이러한 도구는 인종, 민족성, 교육, 지능 등을 예측 인자로 삼는 회귀분석 모델의 일종이다. 최근 머신러닝 알고리즘이 부상함에 따라, 기존의 재범 위험성 측정 도구의 기본 원리 위에 머신러닝 알고리즘을 적용한 새로운 위험평가도구가 속속 개발되었다. 이러한 위험평가도구에서 공통적인 것은 재범에 영향을 미친다고 생각되는 여러 변수를 입력변수로 하고, 머신러닝 알고리즘의 복잡한 연산능력을 사용하여 재범의 위험 점수를 계산하는 것이다. 근래의 위험성 예측 도구는 모두 인공지능 알고리즘을 사용하고 있고, 그 중에서도 머신러닝 알고리즘을 사용하는 경우가 많다. 머신러닝은 명칭에서 알 수 있듯이 막대한 데이터를 이용하여 학습하고, 보다 향상된 성능으로 부여된 임무를 수행한다. 사용자의 사용 과정에서도 학습 기능이 작동되어, 머신러닝 알고리즘을 사용하면, 점차 성능이 개선되는 특징이 있다. 그러나 예측 결과가 편향되고, 차별성을 띄는 등의 문제가 생기면서 호된 비판에 휩싸여 있다. 재범 위험성 평가도구와 함께 널리 쓰이는 것이 예측 치안 알고리즘인데, 범죄 데이터와머신러닝을 사용하여 언제 어디서 범죄가 일어날지를 예측한다. 범죄예측 알고리즘이라고 불리는 예측 치안 알고리즘은 과거의 범죄에 대한 기존 데이터를 분석하면 언제 어디서 새로운 범죄가 발생할 가능성이 가장 높은지 예측할 수 있다는 아이디어에 기초하고 있다. 특정 범죄 유형이 시간과 공간에 군집하는 경향이 있다는 점에 착안하여, 경찰이 유지하고 있는 범죄 기록과 최근의 범죄 발생 지점을 토대로 미래에 범죄가 어디서 일어날지를 예측한다. 이 알고리즘은 오래 전부터 애틀랜타와 로스앤젤레스 등 미국의 60여개 도시에서 경찰의 순찰 인력 배치 등에 실제 활용되고 있으며, 범죄 발생률 저하에 크게 기여하고 있는 것으로 평가받고 있다. 그러나 범죄 통계 조작 등으로 머신러닝 알고리즘에 쓰이는 데이터의 결함이 크고, 데이터에 내재하는 편견 등으로 과거 범죄가 발생한 지역의 범죄 위험이 과대하게 예측되는 등 정확성의 문제뿐만 아니라 역시 인종 차별 등의 문제를 안고 있다. 이런 문제를 해결하기 위해서는 알고리즘의 오류를 인정하고, 이를 해결할 방법을 모색할 필요가 있다. 또한 알고리즘에 사용되는 데이터의 무결성 문제의 중요성을 인식하고, 데이터 수집이나 정제에 상당한 노력을 경주해야 한다. 뿐만 아니라 형사 절차에 주로 사용되는 만큼 절차의 공정성이나 적법절차 보장이라는 측면도 중시하여, 효율적 법집행과 조화하려는 노력이 필요하다.
In this paper, I will focus on tools for predicting risk in the public domain, including predicting the risk of recidivism. In Korea, the introduction or use of such algorithms has not yet been in full swing, but prior to full-scale introduction, it is necessary to preemptively examine various problems of risk prediction by artificial intelligence algorithms. Artificial intelligence algorithms used in the private sector's legal services do not replace the decision-making of legal experts such as lawyers, but rather assist lawyers and enhance the capabilities of lawyers. It is not properly addressed in this paper because it’s legal issue is small, and focuses on the algorithm for predicting the risk of recidivism and the predictive security algorithm, which are mainly used in criminal proceedings. The tool to measure the likelihood of a criminal violating the law again, that is, the risk of recidivism, was first used in the 1930s to determine the prisoners to be released on parole, and is gradually being used to determine the sentence at the time of sentencing. This tool is a type of regression analysis model that uses race, ethnicity, education, and intelligence as predictors. With the recent rise of machine learning algorithms, new risk assessment tools that apply machine learning algorithms on top of the basic principles of existing recidivism risk measurement tools have been developed one after another. What is common in these risk assessment tools is to take as input variables several factors that are thought to have an influence on recidivism, and use the complex computational power of machine learning algorithms to calculate recidivism's risk score. All of the recent risk prediction tools use artificial intelligence algorithms, and among them, machine learning algorithms are frequently used. As the name suggests, machine learning learns using enormous amounts of data and performs tasks assigned with improved performance. The learning function operates even in the user's use process, and when machine learning algorithms are used, the performance gradually improves. However, as the prediction results are biased and differentiating problems arise, they are surrounded by harsh criticism. A widely used predictive security algorithm along with the recidivism risk assessment tool predicts when and where a crime will occur using crime data and machine learning. The predictive policing algorithm, called the crime prediction algorithm, is based on the idea that analyzing existing data on past crimes can predict when and where new crimes are most likely to occur. Based on the fact that certain types of crime tend to cluster in time and space, we predict where the crime will occur in the future based on the criminal record maintained by the police and the recent crime area. This algorithm has long been used for the deployment of police patrol personnel in more than 60 cities in the United States, including Atlanta and Los Angeles, and is evaluated as contributing greatly to lowering the crime rate. However, due to the manipulation of criminal statistics, there are my flaws in the data used in the machine learning algorithm, and the risk of crime in the region where the past crime occurred is overestimated due to the prejudice inherent in the data. The prejudice inherent in the data is not only a problem of accuracy, but also a problem of racial discrimination. In order to solve this problem, it is necessary to acknowledge the error of the algorithm and find a way to solve it. In addition, it is necessary to recognize the importance of the integrity of the data used in the algorithm, and make considerable effort to collect and clean the data. In addition, as it is mainly used in criminal proceedings, it is necessary to make efforts to harmonize with efficient law enforcement by placing importance on the aspects of ensuring fairness of the procedure and ensuring due process.