추가된 도서관 시스템: • 광주남구도서관 (5개관) • 광주시교육청통합도서관 (6개관) • 전남교육청통합도서관 (25개관) • 전남교육청행정자료실 (1개관) • 여수시립도서관 (34개관) • 고흥군립도서관 (7개관) • 광주북구통합도서관 (3개관) • 광주북구작은도서관 (23개관) • 광주북구공공도서관 (5개관) • 전북교육청도서관 (18개관) • 광주광산구통합도서관 (17개관) • 목포시립도서관 (23개관) • 순천시립도서관 (10개관) • 광주시립도서관 (4개관) • 완도군립도서관 (6개관) • 익산시통합도서관 (33개관) • 안산시중앙도서관 (27개관) • 광주서구구립도서관 (4개관) • 광주서구스마트도서관 (4개관) • 광주서구작은도서관 (5개관) • 광주동구도서관 (5개관) • 경남대표도서관 (1개관) • 무안군립도서관 (1개관) • 조선대학교중앙도서관 (1개관) • 조선이공대학교도서관 (1개관) • KCM통합도서관 (33개관) 총 400개 이상 도서관 복본조사 시스템 완성 HTTP API 방식 및 Selenium 크롤링 방식 혼용 브라우저 헤더 최적화 및 80% 화면배율 적용 🤖 Generated with [Claude Code](https://claude.ai/code) Co-Authored-By: Claude <noreply@anthropic.com>
261 lines
9.0 KiB
C#
261 lines
9.0 KiB
C#
using System;
|
|
using System.Threading.Tasks;
|
|
using OpenQA.Selenium;
|
|
using OpenQA.Selenium.Chrome;
|
|
using OpenQA.Selenium.Support.UI;
|
|
using System.Text.RegularExpressions;
|
|
using WebDriverManager;
|
|
using WebDriverManager.DriverConfigs.Impl;
|
|
using System.IO;
|
|
using System.Runtime.InteropServices;
|
|
using UniMarc.SearchModel;
|
|
using OpenQA.Selenium.Chromium;
|
|
|
|
namespace BokBonCheck
|
|
{
|
|
public class KwangjuCityEduLibrarySearcher : ILibrarySearcher
|
|
{
|
|
public int No { get; set; }
|
|
|
|
public string AreaCode { get; set; } = string.Empty;
|
|
public string SiteName { get; protected set; } = "광주시교육청통합도서관";
|
|
public string SiteUrl => "https://lib.gen.go.kr/main/site/search/bookSearch.do#simple";
|
|
|
|
public bool HttpApiMode { get; set; } = false;
|
|
|
|
private ChromiumDriver _driver;
|
|
|
|
public KwangjuCityEduLibrarySearcher(int no, string areaCode, string areaName)
|
|
{
|
|
this.No = no;
|
|
this.AreaCode = areaCode;
|
|
this.SiteName = $"광주시교육청통합도서관({areaName})";
|
|
}
|
|
|
|
public async Task StartDriver(bool showBrowser = false)
|
|
{
|
|
if (_driver == null)
|
|
{
|
|
try
|
|
{
|
|
if (SeleniumHelper.IsReady == false) await SeleniumHelper.Download();
|
|
_driver = await SeleniumHelper.CreateDriver(ShowBrowser:showBrowser);
|
|
Console.WriteLine("KwangjuCityLibrarySearcher Driver 초기화 완료");
|
|
}
|
|
catch (Exception ex)
|
|
{
|
|
Console.WriteLine($"KwangjuCityLibrarySearcher Driver 초기화 실패: {ex.Message}");
|
|
throw new InvalidOperationException($"KwangjuCityLibrarySearcher Driver 초기화에 실패했습니다: {ex.Message}", ex);
|
|
}
|
|
}
|
|
}
|
|
|
|
public void StopDriver()
|
|
{
|
|
if (_driver != null)
|
|
{
|
|
_driver.Quit();
|
|
_driver.Dispose();
|
|
_driver = null;
|
|
}
|
|
}
|
|
|
|
virtual protected void SelectLibrary(WebDriverWait wait)
|
|
{
|
|
try
|
|
{
|
|
// 콤보박스(select) 요소 찾기
|
|
var selectElement = wait.Until(d => d.FindElement(By.CssSelector("#manage_code")));
|
|
var select = new OpenQA.Selenium.Support.UI.SelectElement(selectElement);
|
|
|
|
// value가 "MA"인 옵션 선택
|
|
select.SelectByValue(AreaCode);
|
|
}
|
|
catch
|
|
{
|
|
// 예외 처리 (필요시 로깅 등)
|
|
}
|
|
}
|
|
|
|
public async Task<BookSearchResult> SearchAsync(string searchTerm)
|
|
{
|
|
var result = new BookSearchResult
|
|
{
|
|
SiteName = SiteName,
|
|
SearchTerm = searchTerm,
|
|
SearchTime = DateTime.Now
|
|
};
|
|
|
|
try
|
|
{
|
|
if (_driver == null)
|
|
throw new InvalidOperationException("드라이버가 시작되지 않았습니다. StartDriver()를 먼저 호출하세요.");
|
|
|
|
_driver.Navigate().GoToUrl(SiteUrl);
|
|
|
|
// 페이지 로딩 대기
|
|
var wait = new WebDriverWait(_driver, TimeSpan.FromSeconds(15));
|
|
|
|
// 모든 감지 방법이 끝나면 크롬창 최소화
|
|
// whale 브라우저가 최소화되어 우선해제
|
|
//IntPtr chromeWindow = FindWindow("Chrome_WidgetWin_1", null);
|
|
//if (chromeWindow != IntPtr.Zero)
|
|
//{
|
|
// ShowWindow(chromeWindow, SW_MINIMIZE);
|
|
//}
|
|
|
|
//대상도서관 선택
|
|
SelectLibrary(wait);
|
|
|
|
// 검색창 찾기
|
|
IWebElement searchBox = null;
|
|
try
|
|
{
|
|
// 여러 가능한 선택자 시도
|
|
var selectors = new[]
|
|
{
|
|
"input[id='search_txt']",
|
|
"input[type='text']",
|
|
};
|
|
|
|
foreach (var selector in selectors)
|
|
{
|
|
try
|
|
{
|
|
searchBox = wait.Until(d =>
|
|
{
|
|
var el = d.FindElement(By.CssSelector(selector));
|
|
return (el != null && el.Displayed && el.Enabled) ? el : null;
|
|
});
|
|
break;
|
|
}
|
|
catch
|
|
{
|
|
continue;
|
|
}
|
|
}
|
|
|
|
if (searchBox == null)
|
|
{
|
|
throw new Exception("검색창을 찾을 수 없습니다.");
|
|
}
|
|
}
|
|
catch (Exception ex)
|
|
{
|
|
throw new Exception($"검색창 찾기 실패: {ex.Message}");
|
|
}
|
|
|
|
// 혹시 readonly라면 속성 제거
|
|
((IJavaScriptExecutor)_driver).ExecuteScript("arguments[0].removeAttribute('readonly')", searchBox);
|
|
|
|
// 입력 전 clear
|
|
searchBox.Clear();
|
|
searchBox.SendKeys(searchTerm);
|
|
|
|
// 검색 버튼 클릭
|
|
IWebElement searchButton = null;
|
|
try
|
|
{
|
|
var buttonSelectors = new[]
|
|
{
|
|
"input[type='submit']",
|
|
};
|
|
foreach (var selector in buttonSelectors)
|
|
{
|
|
try
|
|
{
|
|
searchButton = _driver.FindElement(By.CssSelector(selector));
|
|
break;
|
|
}
|
|
catch
|
|
{
|
|
continue;
|
|
}
|
|
}
|
|
|
|
if (searchButton == null)
|
|
{
|
|
// Enter 키로 검색 시도
|
|
searchBox.SendKeys(Keys.Enter);
|
|
}
|
|
else
|
|
{
|
|
searchButton.Click();
|
|
}
|
|
}
|
|
catch (Exception ex)
|
|
{
|
|
// Enter 키로 검색 시도
|
|
searchBox.SendKeys(Keys.Enter);
|
|
}
|
|
|
|
// 페이지 변경을 감지하는 메서드
|
|
await WaitForPageChange(new WebDriverWait(_driver, TimeSpan.FromSeconds(15)));
|
|
|
|
// 검색 결과 수 추출
|
|
var resultCount = ExtractBookCount(_driver);
|
|
|
|
result.BookCount = resultCount;
|
|
result.IsSuccess = true;
|
|
}
|
|
catch (Exception ex)
|
|
{
|
|
result.IsSuccess = false;
|
|
result.ErrorMessage = ex.Message;
|
|
result.BookCount = 0;
|
|
}
|
|
|
|
return result;
|
|
}
|
|
|
|
private int ExtractBookCount(IWebDriver driver)
|
|
{
|
|
try
|
|
{
|
|
// div.search-result 내부의 span에서 '전체 N' 텍스트 추출
|
|
var resultDiv = driver.FindElement(By.CssSelector("div.ndls_result"));
|
|
var span = resultDiv.FindElement(By.XPath(".//span[contains(text(),'전체')]"));
|
|
string text = span.Text; // 예: "전체 5 "
|
|
var match = System.Text.RegularExpressions.Regex.Match(text, @"전체\s*(\d+)");
|
|
if (match.Success)
|
|
{
|
|
return int.Parse(match.Groups[1].Value);
|
|
}
|
|
return 0;
|
|
}
|
|
catch
|
|
{
|
|
return 0;
|
|
}
|
|
}
|
|
|
|
// 페이지 변경을 감지하는 메서드
|
|
public async Task WaitForPageChange(WebDriverWait wait)
|
|
{
|
|
try
|
|
{
|
|
// 방법 4: 페이지 로딩 상태 확인
|
|
wait.Until(d =>
|
|
{
|
|
var readyState = ((IJavaScriptExecutor)d).ExecuteScript("return document.readyState");
|
|
return readyState.Equals("complete");
|
|
});
|
|
|
|
// 방법 5: 특정 텍스트가 페이지에 나타날 때까지 대기
|
|
wait.Until(d =>
|
|
{
|
|
var elm = d.FindElement(By.TagName("body"));
|
|
if (elm == null) return false;
|
|
var pageText = elm.Text;
|
|
return pageText.Contains("전체") || pageText.Contains("건") || pageText.Contains("검색결과");
|
|
});
|
|
}
|
|
catch (Exception ex)
|
|
{
|
|
// 모든 감지 방법이 실패하면 최소한의 대기 시간 적용
|
|
await Task.Delay(2000);
|
|
throw new Exception($"페이지 변경 감지 실패: {ex.Message}");
|
|
}
|
|
}
|
|
}
|
|
} |