Microsoft MVP성태의 닷넷 이야기
글쓴 사람
윤영호
홈페이지
첨부 파일

안녕하세요
윤영호입니다.
제가 c#이 처음이라서 모자른 질문일수도 있으나 답변해주시면 감사하겠습니다.
웹파일을 가지고 와서 DB나 list같은 곳에 저장을 format에 맞추어 저장을 한다음 필요할때 검색하거나 꺼내보는 프로그램을 만들어 볼려고 합니다.
크롤링을 해서 파일을 가지고 왔고 하드디스크에 저장을 한뒤 파일을 꺼내는것까지 확인을 했습니다.

1번째 질문 : 제가 막히는 부분은 XElement 클라스에서 xml 파일에 있는 내용을 정리해서 DB or list로 저장을 하는 것 입니다.
            xml에 여러 <item>있는데 막히는 c#소스코드에서 1번째<item>는 textbox1에 2번째<item>는 textbox2에 출력하는 것입니다.

2번째 질문 :web.xml에 이상한 특수 기호가 뜨는데 혹시 제가 잘못 크롤링한 것인가요??

---------------------------------------막히는 c#소스코드----------------------------------------

            using (FileStream fs = new FileStream("web.xml",FileMode.Open)) { //web.xml--->첨부파일 포함파일입니다.
                StreamReader sw = new StreamReader(fs, Encoding.UTF8);
                string StrNews=sw.ReadToEnd();
                TextReader strNewsReader = new StringReader(StrNews);
                
                XElement root = XElement.Load(strNewsReader);
                textBox1.Text=root.Element("channel").Element("item").Element("title").Value;
                textBox2.Text=root.Element("channel").Element("item").Element("title").Value;


            }

-----------------------------------------------------------------------------------------------

3번째 질문 : 혹시 아래있는 소스는 제가 원하는 데로 동작을 하긴 하는 데 부족한 부분이 있다면 알려주시면 감사하겠습니다.

--------------------------------------저장하는 C# 소스---------------------------------------------------------

            using (FileStream fs=new FileStream("web.xml",FileMode.Create)) {
                StreamWriter sw = new StreamWriter(fs,Encoding.UTF8);
                sw.WriteLine(WebCrawling("https://www.yonhapnewstv.co.kr/browse/feed/"));
                sw.Flush();
            }
-
--------------------------------------------------------------------------------------------------------------

------------------------------WebCrawling C# 소스---------------------------------------------------------------------------------
public string WebCrawling(string website){
            HttpWebRequest req = WebRequest.Create(website) as HttpWebRequest;
            HttpWebResponse resp = req.GetResponse() as HttpWebResponse;

            using (StreamReader sr= new StreamReader(resp.GetResponseStream())) {
                string responseText = sr.ReadToEnd();
                //int titleNum = responseText.LastIndexOf("<title>");
                textBox1.Text = responseText;

                return responseText;

            }
            //return "";

        }
------------------------------------------------------------------------------------------------------------------


끝 까지 봐주셔서 감사합니다








[최초 등록일: ]
[최종 수정일: 1/8/2021]


비밀번호

댓글 작성자
 



2021-01-08 08시33분
우선 첫 번째는, XPath를 이용한 node 선택을 하면 됩니다. 이에 대해서는 다음의 글을 참고하세요.

How to query LINQ to XML using XPath (LINQ to XML)
; https://docs.microsoft.com/en-us/dotnet/standard/linq/query-linq-xml-xpath

두 번째 질문은 어떤 특수 기호를 말하는 건가요? 설령 특수 기호가 있다고 해도 Internet Explorer 등을 이용해 XML 파일을 열어 적법한 형식에 맞기만 하면 상관없으니 무시해도 됩니다.

세 번째 질문은 좀 더 간단하냐 정도의 문제만 있을 뿐 그렇게 해도 무방합니다.

(그리고 다음 번에 질문하실 때는 소스 코드 파일만 올리지 마시고 프로젝트 파일까지 포함한 유형으로 첨부해 주세요.)
정성태

... 91  92  93  94  95  96  [97] 
NoWriterDateCnt.TitleFile(s)
29정성태12/17/200310837    답변글 [답변]: IE에서 submit 버튼을 누를때 발생하는 이벤트를 받을수 있나요?
24임영택9/14/200310907실행중인 DLL과 통신하는 방법?
25임영택9/15/200311045    답변글 [답변]: 자답(해결했습니다)
21박용운7/29/200310596잠긴파일에서...
22박용운7/30/200312020    답변글 왜 MoveFileEx가 먹히지를 않을까요?
23박용운7/30/200311951        답변글 [자답]
19김진호7/28/200311026atl 디버깅
20정성태7/29/200310850    답변글 [답변]: atl 디버깅
17박용운7/23/200311330[질문] 보안모듈? [1]
13박용운7/23/200311905"IE BHO 개체를 개발할 때, 인터넷 익스플로러가 아닌 탐색기에서 활성화 되는 문제 해결" 문서를 읽고...
14정성태7/23/200310749    답변글 [답변]: "IE BHO 개체를 개발할 때, 인터넷 익스플로러가 아닌 탐색기에서 활성화 되는 문제 해결" 문서를 읽고...
16박용운7/23/200311342        답변글 [답변]: [답변]: "IE BHO 개체를 개발할 때, 인터넷 익스플로러가 아닌 탐색기에서 활성화 되는 문제 해결" 문서를 읽고...
7박용운7/21/200313018HTTP 프로토콜로 통신하는법? [5]
6박용운7/21/200313380POST값을 못읽는 사이트는? [1]
1박용운7/18/200315302[질문] IWebBrowser2로 POST값 구하기 [4]파일 다운로드1
... 91  92  93  94  95  96  [97]