Microsoft MVP성태의 닷넷 이야기
글쓴 사람
윤영호
홈페이지
첨부 파일

안녕하세요
윤영호입니다.
제가 c#이 처음이라서 모자른 질문일수도 있으나 답변해주시면 감사하겠습니다.
웹파일을 가지고 와서 DB나 list같은 곳에 저장을 format에 맞추어 저장을 한다음 필요할때 검색하거나 꺼내보는 프로그램을 만들어 볼려고 합니다.
크롤링을 해서 파일을 가지고 왔고 하드디스크에 저장을 한뒤 파일을 꺼내는것까지 확인을 했습니다.

1번째 질문 : 제가 막히는 부분은 XElement 클라스에서 xml 파일에 있는 내용을 정리해서 DB or list로 저장을 하는 것 입니다.
            xml에 여러 <item>있는데 막히는 c#소스코드에서 1번째<item>는 textbox1에 2번째<item>는 textbox2에 출력하는 것입니다.

2번째 질문 :web.xml에 이상한 특수 기호가 뜨는데 혹시 제가 잘못 크롤링한 것인가요??

---------------------------------------막히는 c#소스코드----------------------------------------

            using (FileStream fs = new FileStream("web.xml",FileMode.Open)) { //web.xml--->첨부파일 포함파일입니다.
                StreamReader sw = new StreamReader(fs, Encoding.UTF8);
                string StrNews=sw.ReadToEnd();
                TextReader strNewsReader = new StringReader(StrNews);
                
                XElement root = XElement.Load(strNewsReader);
                textBox1.Text=root.Element("channel").Element("item").Element("title").Value;
                textBox2.Text=root.Element("channel").Element("item").Element("title").Value;


            }

-----------------------------------------------------------------------------------------------

3번째 질문 : 혹시 아래있는 소스는 제가 원하는 데로 동작을 하긴 하는 데 부족한 부분이 있다면 알려주시면 감사하겠습니다.

--------------------------------------저장하는 C# 소스---------------------------------------------------------

            using (FileStream fs=new FileStream("web.xml",FileMode.Create)) {
                StreamWriter sw = new StreamWriter(fs,Encoding.UTF8);
                sw.WriteLine(WebCrawling("https://www.yonhapnewstv.co.kr/browse/feed/"));
                sw.Flush();
            }
-
--------------------------------------------------------------------------------------------------------------

------------------------------WebCrawling C# 소스---------------------------------------------------------------------------------
public string WebCrawling(string website){
            HttpWebRequest req = WebRequest.Create(website) as HttpWebRequest;
            HttpWebResponse resp = req.GetResponse() as HttpWebResponse;

            using (StreamReader sr= new StreamReader(resp.GetResponseStream())) {
                string responseText = sr.ReadToEnd();
                //int titleNum = responseText.LastIndexOf("<title>");
                textBox1.Text = responseText;

                return responseText;

            }
            //return "";

        }
------------------------------------------------------------------------------------------------------------------


끝 까지 봐주셔서 감사합니다








[최초 등록일: ]
[최종 수정일: 1/8/2021]


비밀번호

댓글 작성자
 



2021-01-08 08시33분
우선 첫 번째는, XPath를 이용한 node 선택을 하면 됩니다. 이에 대해서는 다음의 글을 참고하세요.

How to query LINQ to XML using XPath (LINQ to XML)
; https://docs.microsoft.com/en-us/dotnet/standard/linq/query-linq-xml-xpath

두 번째 질문은 어떤 특수 기호를 말하는 건가요? 설령 특수 기호가 있다고 해도 Internet Explorer 등을 이용해 XML 파일을 열어 적법한 형식에 맞기만 하면 상관없으니 무시해도 됩니다.

세 번째 질문은 좀 더 간단하냐 정도의 문제만 있을 뿐 그렇게 해도 무방합니다.

(그리고 다음 번에 질문하실 때는 소스 코드 파일만 올리지 마시고 프로젝트 파일까지 포함한 유형으로 첨부해 주세요.)
정성태

... 46  47  48  49  50  51  52  53  54  [55]  56  57  58  59  60  ...
NoWriterDateCnt.TitleFile(s)
1279(non...6/23/201411614(글쓴이의 요청으로 삭제합니다.) [17]
1278이상식6/19/201412833.net DLL 내 자바스크립트를 수정 또는 재정의 할 수 있을까요? [3]
1277김솔지6/18/201410527silverlight에서 datagrid, listbox질문이여 [2]
1276정우석6/16/201410047쿠키 [1]
1274김솔지6/10/201414528배포 페이지 url을 얻고 싶습니다. [8]
1272이훈모6/7/201410090정말 어려운 상황에 직면했습니다. [1]
1270Jong...6/2/201419550C#과 C++을 이용한 Image 처리. [13]
1269김아영5/29/201410233InitializeComponent 함수 호출 지연 현상 [5]
1268솔솔5/27/20149874smart client [1]
1266김솔지5/22/201411953clickonce 수정에 대해 알고싶습니다. [2]
1265이은아5/22/201415563DataGridView 헤더를 두줄이상으로 하고싶습니다. [1]파일 다운로드1
1264김인호5/18/201413168소스코드 및 예제그림 zip 파일 [1]
1263이영종5/15/201411606159페이지 오타인것 같습니다 [5]
1262(non...5/4/201412468(글쓴이의 요청으로 삭제합니다.) [10]
1261이근주5/4/201410777다시 한번 질문드릴께요. [2]
1259이근주5/1/20149821도서 오류인 것 같네요.. [1]
1258최세정4/28/201412233안녕하세요~php module 오류로 고민하다가 여기까지 왔네요..ㅜㅜ [2]
1252popo4/21/201411497바인딩 질문입니다. [2]
1251(non...4/20/201415619(글쓴이의 요청으로 삭제합니다.) [11]
1249홍용규4/17/201415619app.config 파일 관련 질문 있습니다. [2]
1246(non...3/30/201411942(글쓴이의 요청으로 삭제합니다.) [1]
1245POPO3/26/201411351Http 프로토콜 관련 질문 입니다. [1]
1244(non...3/26/201411455(글쓴이의 요청으로 삭제합니다.) [1]
1241(non...3/22/201415234(글쓴이의 요청으로 삭제합니다.) [4]
1240이석주3/21/201418135인터넷 익스플로러가 hang이 걸리는 현상 문의 [1]파일 다운로드1
1238(non...3/13/201411995(글쓴이의 요청으로 삭제합니다.) [2]
... 46  47  48  49  50  51  52  53  54  [55]  56  57  58  59  60  ...