Microsoft MVP성태의 닷넷 이야기
글쓴 사람
윤영호
홈페이지
첨부 파일

안녕하세요
윤영호입니다.
제가 c#이 처음이라서 모자른 질문일수도 있으나 답변해주시면 감사하겠습니다.
웹파일을 가지고 와서 DB나 list같은 곳에 저장을 format에 맞추어 저장을 한다음 필요할때 검색하거나 꺼내보는 프로그램을 만들어 볼려고 합니다.
크롤링을 해서 파일을 가지고 왔고 하드디스크에 저장을 한뒤 파일을 꺼내는것까지 확인을 했습니다.

1번째 질문 : 제가 막히는 부분은 XElement 클라스에서 xml 파일에 있는 내용을 정리해서 DB or list로 저장을 하는 것 입니다.
            xml에 여러 <item>있는데 막히는 c#소스코드에서 1번째<item>는 textbox1에 2번째<item>는 textbox2에 출력하는 것입니다.

2번째 질문 :web.xml에 이상한 특수 기호가 뜨는데 혹시 제가 잘못 크롤링한 것인가요??

---------------------------------------막히는 c#소스코드----------------------------------------

            using (FileStream fs = new FileStream("web.xml",FileMode.Open)) { //web.xml--->첨부파일 포함파일입니다.
                StreamReader sw = new StreamReader(fs, Encoding.UTF8);
                string StrNews=sw.ReadToEnd();
                TextReader strNewsReader = new StringReader(StrNews);
                
                XElement root = XElement.Load(strNewsReader);
                textBox1.Text=root.Element("channel").Element("item").Element("title").Value;
                textBox2.Text=root.Element("channel").Element("item").Element("title").Value;


            }

-----------------------------------------------------------------------------------------------

3번째 질문 : 혹시 아래있는 소스는 제가 원하는 데로 동작을 하긴 하는 데 부족한 부분이 있다면 알려주시면 감사하겠습니다.

--------------------------------------저장하는 C# 소스---------------------------------------------------------

            using (FileStream fs=new FileStream("web.xml",FileMode.Create)) {
                StreamWriter sw = new StreamWriter(fs,Encoding.UTF8);
                sw.WriteLine(WebCrawling("https://www.yonhapnewstv.co.kr/browse/feed/"));
                sw.Flush();
            }
-
--------------------------------------------------------------------------------------------------------------

------------------------------WebCrawling C# 소스---------------------------------------------------------------------------------
public string WebCrawling(string website){
            HttpWebRequest req = WebRequest.Create(website) as HttpWebRequest;
            HttpWebResponse resp = req.GetResponse() as HttpWebResponse;

            using (StreamReader sr= new StreamReader(resp.GetResponseStream())) {
                string responseText = sr.ReadToEnd();
                //int titleNum = responseText.LastIndexOf("<title>");
                textBox1.Text = responseText;

                return responseText;

            }
            //return "";

        }
------------------------------------------------------------------------------------------------------------------


끝 까지 봐주셔서 감사합니다








[최초 등록일: ]
[최종 수정일: 1/8/2021]


비밀번호

댓글 작성자
 



2021-01-08 08시33분
우선 첫 번째는, XPath를 이용한 node 선택을 하면 됩니다. 이에 대해서는 다음의 글을 참고하세요.

How to query LINQ to XML using XPath (LINQ to XML)
; https://docs.microsoft.com/en-us/dotnet/standard/linq/query-linq-xml-xpath

두 번째 질문은 어떤 특수 기호를 말하는 건가요? 설령 특수 기호가 있다고 해도 Internet Explorer 등을 이용해 XML 파일을 열어 적법한 형식에 맞기만 하면 상관없으니 무시해도 됩니다.

세 번째 질문은 좀 더 간단하냐 정도의 문제만 있을 뿐 그렇게 해도 무방합니다.

(그리고 다음 번에 질문하실 때는 소스 코드 파일만 올리지 마시고 프로젝트 파일까지 포함한 유형으로 첨부해 주세요.)
정성태

... [91]  92  93  94  95  96  97 
NoWriterDateCnt.TitleFile(s)
189정성태5/10/200511031            답변글 [답변]: [답변]: [답변]: 네트워크 케이블의 연결상태 [2]
191최정희5/11/200510701                답변글 [답변]: [답변]: [답변]: [답변]: 네트워크 케이블의 연결상태 [1]
175안연준5/3/200511136IE 제어에 대한 궁금 증 ㅡ,.ㅡ;;
179정성태5/4/200511736    답변글 [답변]: IE 제어에 대한 궁금 증 ㅡ,.ㅡ;;
168안연준5/2/200511308[Database] Connection Error파일 다운로드1
169정성태5/2/200511359    답변글 [답변]: [Database] Connection Error
170안연준5/2/200510789        답변글 [답변]: [답변]: 계속 에러가 똑같애요
171정성태5/2/200511537            답변글 [답변]: [답변]: [답변]: 계속 에러가 똑같애요
172안연준5/2/200511393                답변글 [답변]: [답변]: [답변]: [답변]: 계속 에러가 똑같애요파일 다운로드1
173정성태5/2/200511204                    답변글 [답변]: [답변]: [답변]: [답변]: [답변]: 계속 에러가 똑같애요
174안연준5/3/200511199                        답변글 [답변]: [답변]: [답변]: [답변]: [답변]: [답변]: 계속 에러가 똑같애요
165장희석4/22/200511740[질문]ASP에서 ATL 서버 컴퍼넌트로 바이너리 데이타 전달하기
167정성태4/29/200511615    답변글 [답변]: [질문]ASP에서 ATL 서버 컴퍼넌트로 바이너리 데이타 전달하기
160카심4/21/200511135Internet Explorer 에서의 닷넷 Smart Client 개발
163정성태4/22/200510872    답변글 [답변]: Internet Explorer 에서의 닷넷 Smart Client 개발
159신대철4/21/200510794자동 로긴 프로그램
162정성태4/22/200510858    답변글 [답변]: 자동 로긴 프로그램
166신대철4/22/200510567        답변글 [답변]: [답변]: 자동 로긴 프로그램파일 다운로드1
157이용휘4/20/200510508w3ip를 통해서 윈도우 미디어 화을을 올려놓을 서버..
158정성태4/20/200510868    답변글 [답변]: w3ip를 통해서 윈도우 미디어 화을을 올려놓을 서버..
155최성우4/18/200512663[질문(--),(__)]BHO로 자동 로그인 기능 구현.. 패스워드를 읽어오지를 못합니다.
156정성태4/19/200511234    답변글 [답변]: [질문(--),(__)]BHO로 자동 로그인 기능 구현.. 패스워드를 읽어오지를 못합니다.
161최성우4/21/200512439        답변글 [답변]: [답변]: [질문(--),(__)]BHO로 자동 로그인 기능 구현.. 패스워드를 읽어오지를 못합니다.
164정성태4/22/200511261            답변글 [답변]: [답변]: [답변]: [질문(--),(__)]BHO로 자동 로그인 기능 구현.. 패스워드를 읽어오지를 못합니다.
176최성우5/3/200511493                답변글 [답변]: [답변]: [답변]: [답변]: [질문(--),(__)]BHO로 자동 로그인 기능 구현.. 패스워드를 읽어오지를 못합니다.
146안연준4/14/200512324컴포넌트 안에 컴포넌트 삽입? 헐 ! -_-;;
... [91]  92  93  94  95  96  97