تجزیه و تحلیل داده های XML

زبان نشانه گذاری توسعه پذیر (XML) مجموعه ای از قوانین برای رمزگذاری اسناد به شکل قابل خواندن توسط ماشین است. XML یک فرمت محبوب برای به اشتراک گذاری داده ها در اینترنت است.

وب‌سایت‌هایی که مکرراً محتوای خود را به‌روزرسانی می‌کنند، مانند سایت‌های خبری یا وبلاگ‌ها، اغلب یک فید XML ارائه می‌کنند تا برنامه‌های خارجی بتوانند از تغییرات محتوا مطلع شوند. آپلود و تجزیه داده های XML یک کار معمول برای برنامه های متصل به شبکه است. این مبحث نحوه تجزیه اسناد XML و استفاده از داده های آنها را توضیح می دهد.

برای کسب اطلاعات بیشتر در مورد ایجاد محتوای مبتنی بر وب در برنامه Android خود، به محتوای مبتنی بر وب مراجعه کنید.

تجزیه کننده را انتخاب کنید

ما XmlPullParser را توصیه می کنیم که راهی کارآمد و قابل نگهداری برای تجزیه XML در اندروید است. اندروید دو پیاده سازی از این رابط دارد:

هر دو انتخاب خوب است. مثال در این بخش از ExpatPullParser و Xml.newPullParser() استفاده می کند.

آنالیز خوراک

اولین گام در تجزیه فید این است که تصمیم بگیرید به کدام فیلدها علاقه دارید. تجزیه کننده داده ها را برای آن فیلدها استخراج می کند و بقیه را نادیده می گیرد.

گزیده زیر را از یک فید تجزیه شده در برنامه نمونه ببینید. هر پست به StackOverflow.com در فید به‌عنوان یک تگ entry ظاهر می‌شود که حاوی چندین تگ تو در تو است:

<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule" ...">
<title type="text">newest questions tagged android - Stack Overflow</title>
...
    <entry>
    ...
    </entry>
    <entry>
        <id>http://stackoverflow.com/q/9439999</id>
        <re:rank scheme="http://stackoverflow.com">0</re:rank>
        <title type="text">Where is my data file?</title>
        <category scheme="http://stackoverflow.com/feeds/tag?tagnames=android&sort=newest/tags" term="android"/>
        <category scheme="http://stackoverflow.com/feeds/tag?tagnames=android&sort=newest/tags" term="file"/>
        <author>
            <name>cliff2310</name>
            <uri>http://stackoverflow.com/users/1128925</uri>
        </author>
        <link rel="alternate" href="http://stackoverflow.com/questions/9439999/where-is-my-data-file" />
        <published>2012-02-25T00:30:54Z</published>
        <updated>2012-02-25T00:30:54Z</updated>
        <summary type="html">
            <p>I have an Application that requires a data file...</p>

        </summary>
    </entry>
    <entry>
    ...
    </entry>
...
</feed>

برنامه نمونه داده ها را برای برچسب entry و title ، link و summary برچسب های تودرتو استخراج می کند.

تجزیه کننده را نمونه سازی کنید

مرحله بعدی در تجزیه یک خوراک، نمونه سازی یک تجزیه کننده و شروع فرآیند تجزیه است. این قطعه یک تجزیه کننده را مقداردهی اولیه می کند تا فضاهای نام را پردازش نکند و از InputStream ارائه شده به عنوان ورودی خود استفاده کند. فرآیند تجزیه را با فراخوانی به nextTag() آغاز می‌کند و متد readFeed() را فراخوانی می‌کند که داده‌های مورد علاقه برنامه را استخراج و پردازش می‌کند:

کاتلین

// We don't use namespaces.
private val ns: String? = null

class StackOverflowXmlParser {

    @Throws(XmlPullParserException::class, IOException::class)
    fun parse(inputStream: InputStream): List<*> {
        inputStream.use { inputStream ->
            val parser: XmlPullParser = Xml.newPullParser()
            parser.setFeature(XmlPullParser.FEATURE_PROCESS_NAMESPACES, false)
            parser.setInput(inputStream, null)
            parser.nextTag()
            return readFeed(parser)
        }
    }
 ...
}

جاوا

public class StackOverflowXmlParser {
    // We don't use namespaces.
    private static final String ns = null;

    public List parse(InputStream in) throws XmlPullParserException, IOException {
        try {
            XmlPullParser parser = Xml.newPullParser();
            parser.setFeature(XmlPullParser.FEATURE_PROCESS_NAMESPACES, false);
            parser.setInput(in, null);
            parser.nextTag();
            return readFeed(parser);
        } finally {
            in.close();
        }
    }
 ...
}

فید را بخوانید

متد readFeed() کار واقعی پردازش فید را انجام می دهد. به دنبال عناصری با برچسب "ورود" به عنوان نقطه شروع برای پردازش بازگشتی فید می گردد. اگر یک تگ یک تگ entry نباشد، آن را رد می کند. هنگامی که کل فید به صورت بازگشتی پردازش می‌شود، readFeed() List حاوی ورودی‌ها (از جمله اعضای داده تودرتو) استخراج شده از فید را برمی‌گرداند. سپس این List توسط تجزیه کننده برگردانده می شود.

کاتلین

@Throws(XmlPullParserException::class, IOException::class)
private fun readFeed(parser: XmlPullParser): List<Entry> {
    val entries = mutableListOf<Entry>()

    parser.require(XmlPullParser.START_TAG, ns, "feed")
    while (parser.next() != XmlPullParser.END_TAG) {
        if (parser.eventType != XmlPullParser.START_TAG) {
            continue
        }
        // Starts by looking for the entry tag.
        if (parser.name == "entry") {
            entries.add(readEntry(parser))
        } else {
            skip(parser)
        }
    }
    return entries
}

جاوا

private List readFeed(XmlPullParser parser) throws XmlPullParserException, IOException {
    List entries = new ArrayList();

    parser.require(XmlPullParser.START_TAG, ns, "feed");
    while (parser.next() != XmlPullParser.END_TAG) {
        if (parser.getEventType() != XmlPullParser.START_TAG) {
            continue;
        }
        String name = parser.getName();
        // Starts by looking for the entry tag.
        if (name.equals("entry")) {
            entries.add(readEntry(parser));
        } else {
            skip(parser);
        }
    }
    return entries;
}

XML را تجزیه کنید

مراحل تجزیه یک فید XML به شرح زیر است:

  1. همانطور که در تجزیه و تحلیل فید توضیح داده شد، برچسب هایی را که می خواهید در برنامه خود قرار دهید شناسایی کنید. این مثال داده‌ها را برای تگ entry و برچسب‌های تودرتوی آن استخراج می‌کند: title ، link ، و summary .
  2. روش های زیر را ایجاد کنید:

    • یک روش "read" برای هر برچسبی که می خواهید اضافه کنید، مانند readEntry() و readTitle() . تجزیه کننده برچسب ها را از جریان ورودی می خواند. هنگامی که با برچسبی به نام، در این مثال، entry ، title ، link یا summary مواجه می شود، متد مناسب آن تگ را فراخوانی می کند. در غیر این صورت، از تگ می گذرد.
    • روش‌هایی برای استخراج داده‌ها برای هر نوع برچسب مختلف و پیشبرد تجزیه‌کننده به تگ بعدی. در این مثال، روش های مربوطه به شرح زیر است:
      • برای تگ های title و summary ، تجزیه کننده readText() را فراخوانی می کند. این روش با فراخوانی parser.getText() داده‌های این تگ‌ها را استخراج می‌کند.
      • برای تگ link ، تجزیه‌کننده داده‌ها را برای پیوندها استخراج می‌کند و ابتدا تعیین می‌کند که آیا پیوند از نوع مورد علاقه‌اش است یا خیر. سپس از parser.getAttributeValue() برای استخراج ارزش پیوند استفاده می‌کند.
      • برای تگ entry ، تجزیه کننده readEntry() فراخوانی می کند. این روش تگ های تودرتوی ورودی را تجزیه می کند و یک شیء Entry را با title اعضای داده، link و summary برمی گرداند.
    • یک روش کمکی skip() که بازگشتی است. برای بحث بیشتر در مورد این موضوع، به رد شدن از برچسب هایی که برایتان مهم نیست مراجعه کنید.

این قطعه نشان می دهد که چگونه تجزیه کننده ورودی ها، عنوان ها، پیوندها و خلاصه ها را تجزیه می کند.

کاتلین

data class Entry(val title: String?, val summary: String?, val link: String?)

// Parses the contents of an entry. If it encounters a title, summary, or link tag, hands them off
// to their respective "read" methods for processing. Otherwise, skips the tag.
@Throws(XmlPullParserException::class, IOException::class)
private fun readEntry(parser: XmlPullParser): Entry {
    parser.require(XmlPullParser.START_TAG, ns, "entry")
    var title: String? = null
    var summary: String? = null
    var link: String? = null
    while (parser.next() != XmlPullParser.END_TAG) {
        if (parser.eventType != XmlPullParser.START_TAG) {
            continue
        }
        when (parser.name) {
            "title" -> title = readTitle(parser)
            "summary" -> summary = readSummary(parser)
            "link" -> link = readLink(parser)
            else -> skip(parser)
        }
    }
    return Entry(title, summary, link)
}

// Processes title tags in the feed.
@Throws(IOException::class, XmlPullParserException::class)
private fun readTitle(parser: XmlPullParser): String {
    parser.require(XmlPullParser.START_TAG, ns, "title")
    val title = readText(parser)
    parser.require(XmlPullParser.END_TAG, ns, "title")
    return title
}

// Processes link tags in the feed.
@Throws(IOException::class, XmlPullParserException::class)
private fun readLink(parser: XmlPullParser): String {
    var link = ""
    parser.require(XmlPullParser.START_TAG, ns, "link")
    val tag = parser.name
    val relType = parser.getAttributeValue(null, "rel")
    if (tag == "link") {
        if (relType == "alternate") {
            link = parser.getAttributeValue(null, "href")
            parser.nextTag()
        }
    }
    parser.require(XmlPullParser.END_TAG, ns, "link")
    return link
}

// Processes summary tags in the feed.
@Throws(IOException::class, XmlPullParserException::class)
private fun readSummary(parser: XmlPullParser): String {
    parser.require(XmlPullParser.START_TAG, ns, "summary")
    val summary = readText(parser)
    parser.require(XmlPullParser.END_TAG, ns, "summary")
    return summary
}

// For the tags title and summary, extracts their text values.
@Throws(IOException::class, XmlPullParserException::class)
private fun readText(parser: XmlPullParser): String {
    var result = ""
    if (parser.next() == XmlPullParser.TEXT) {
        result = parser.text
        parser.nextTag()
    }
    return result
}
...

جاوا

public static class Entry {
    public final String title;
    public final String link;
    public final String summary;

    private Entry(String title, String summary, String link) {
        this.title = title;
        this.summary = summary;
        this.link = link;
    }
}

// Parses the contents of an entry. If it encounters a title, summary, or link tag, hands them off
// to their respective "read" methods for processing. Otherwise, skips the tag.
private Entry readEntry(XmlPullParser parser) throws XmlPullParserException, IOException {
    parser.require(XmlPullParser.START_TAG, ns, "entry");
    String title = null;
    String summary = null;
    String link = null;
    while (parser.next() != XmlPullParser.END_TAG) {
        if (parser.getEventType() != XmlPullParser.START_TAG) {
            continue;
        }
        String name = parser.getName();
        if (name.equals("title")) {
            title = readTitle(parser);
        } else if (name.equals("summary")) {
            summary = readSummary(parser);
        } else if (name.equals("link")) {
            link = readLink(parser);
        } else {
            skip(parser);
        }
    }
    return new Entry(title, summary, link);
}

// Processes title tags in the feed.
private String readTitle(XmlPullParser parser) throws IOException, XmlPullParserException {
    parser.require(XmlPullParser.START_TAG, ns, "title");
    String title = readText(parser);
    parser.require(XmlPullParser.END_TAG, ns, "title");
    return title;
}

// Processes link tags in the feed.
private String readLink(XmlPullParser parser) throws IOException, XmlPullParserException {
    String link = "";
    parser.require(XmlPullParser.START_TAG, ns, "link");
    String tag = parser.getName();
    String relType = parser.getAttributeValue(null, "rel");
    if (tag.equals("link")) {
        if (relType.equals("alternate")){
            link = parser.getAttributeValue(null, "href");
            parser.nextTag();
        }
    }
    parser.require(XmlPullParser.END_TAG, ns, "link");
    return link;
}

// Processes summary tags in the feed.
private String readSummary(XmlPullParser parser) throws IOException, XmlPullParserException {
    parser.require(XmlPullParser.START_TAG, ns, "summary");
    String summary = readText(parser);
    parser.require(XmlPullParser.END_TAG, ns, "summary");
    return summary;
}

// For the tags title and summary, extracts their text values.
private String readText(XmlPullParser parser) throws IOException, XmlPullParserException {
    String result = "";
    if (parser.next() == XmlPullParser.TEXT) {
        result = parser.getText();
        parser.nextTag();
    }
    return result;
}
  ...
}

از برچسب هایی که برایتان مهم نیست بگذرید

تجزیه کننده باید از برچسب هایی که به آنها علاقه ای ندارد بگذرد. ​​در اینجا متد skip() تجزیه کننده است:

کاتلین

@Throws(XmlPullParserException::class, IOException::class)
private fun skip(parser: XmlPullParser) {
    if (parser.eventType != XmlPullParser.START_TAG) {
        throw IllegalStateException()
    }
    var depth = 1
    while (depth != 0) {
        when (parser.next()) {
            XmlPullParser.END_TAG -> depth--
            XmlPullParser.START_TAG -> depth++
        }
    }
}

جاوا

private void skip(XmlPullParser parser) throws XmlPullParserException, IOException {
    if (parser.getEventType() != XmlPullParser.START_TAG) {
        throw new IllegalStateException();
    }
    int depth = 1;
    while (depth != 0) {
        switch (parser.next()) {
        case XmlPullParser.END_TAG:
            depth--;
            break;
        case XmlPullParser.START_TAG:
            depth++;
            break;
        }
    }
 }

این روش کار می کند:

  • اگر رویداد فعلی یک START_TAG نباشد، یک استثنا ایجاد می‌کند.
  • START_TAG و همه رویدادها تا و از جمله END_TAG منطبق را مصرف می‌کند.
  • عمق تودرتو را پیگیری می کند تا مطمئن شود که در END_TAG صحیح متوقف می شود و نه در اولین برچسبی که بعد از START_TAG اصلی با آن مواجه می شود.

بنابراین، اگر عنصر فعلی دارای عناصر تو در تو باشد، مقدار depth 0 نخواهد بود تا زمانی که تجزیه کننده همه رویدادهای بین START_TAG اصلی و END_TAG منطبق با آن را مصرف کند. به عنوان مثال، در نظر بگیرید که چگونه تجزیه کننده از عنصر <author> که دارای 2 عنصر تودرتو است، <name> و <uri> می گذرد:

  • اولین بار از طریق حلقه while ، برچسب بعدی که تجزیه کننده بعد از <author> با آن مواجه می شود، START_TAG برای <name> است. مقدار افزایش depth تا 2.
  • دومین بار از طریق حلقه while ، برچسب بعدی که تجزیه کننده با آن مواجه می شود END_TAG </name> است. مقدار depth به 1 کاهش می یابد.
  • سومین بار از طریق حلقه while ، برچسب بعدی که تجزیه کننده با آن مواجه می شود START_TAG <uri> است. مقدار افزایش depth تا 2.
  • چهارمین بار از طریق حلقه while ، برچسب بعدی که تجزیه کننده با آن مواجه می شود END_TAG </uri> است. مقدار depth به 1 کاهش می یابد.
  • بار پنجم و آخرین بار از طریق حلقه while ، برچسب بعدی که تجزیه کننده با آن مواجه می شود END_TAG </author> است. مقدار depth به 0 کاهش می یابد، که نشان می دهد عنصر <author> با موفقیت رد شده است.

داده های XML را مصرف کنید

برنامه مثالی فید XML را به صورت ناهمزمان واکشی و تجزیه می کند. این کار پردازش را از رشته اصلی UI حذف می کند. وقتی پردازش کامل شد، برنامه رابط کاربری را در فعالیت اصلی خود، NetworkActivity ، به‌روزرسانی می‌کند.

در گزیده زیر، متد loadPage() کارهای زیر را انجام می دهد:

  • یک متغیر رشته را با URL برای خوراک XML راه اندازی می کند.
  • اگر تنظیمات کاربر و اتصال شبکه اجازه دهد، روش downloadXml(url) را فراخوانی می‌کند. این روش فید را دانلود و تجزیه می کند و نتیجه رشته ای را برای نمایش در UI برمی گرداند.

کاتلین

class NetworkActivity : Activity() {

    companion object {

        const val WIFI = "Wi-Fi"
        const val ANY = "Any"
        const val SO_URL = "http://stackoverflow.com/feeds/tag?tagnames=android&sort=newest"
        // Whether there is a Wi-Fi connection.
        private var wifiConnected = false
        // Whether there is a mobile connection.
        private var mobileConnected = false

        // Whether the display should be refreshed.
        var refreshDisplay = true
        // The user's current network preference setting.
        var sPref: String? = null
    }
    ...
    // Asynchronously downloads the XML feed from stackoverflow.com.
    fun loadPage() {

        if (sPref.equals(ANY) && (wifiConnected || mobileConnected)) {
            downloadXml(SO_URL)
        } else if (sPref.equals(WIFI) && wifiConnected) {
            downloadXml(SO_URL)
        } else {
            // Show error.
        }
    }
    ...
}

جاوا

public class NetworkActivity extends Activity {
    public static final String WIFI = "Wi-Fi";
    public static final String ANY = "Any";
    private static final String URL = "http://stackoverflow.com/feeds/tag?tagnames=android&sort=newest";

    // Whether there is a Wi-Fi connection.
    private static boolean wifiConnected = false;
    // Whether there is a mobile connection.
    private static boolean mobileConnected = false;
    // Whether the display should be refreshed.
    public static boolean refreshDisplay = true;
    public static String sPref = null;
    ...
    // Asynchronously downloads the XML feed from stackoverflow.com.
    public void loadPage() {

        if((sPref.equals(ANY)) && (wifiConnected || mobileConnected)) {
            downloadXml(URL);
        }
        else if ((sPref.equals(WIFI)) && (wifiConnected)) {
            downloadXml(URL);
        } else {
            // Show error.
        }
    }

متد downloadXml متدهای زیر را در Kotlin فراخوانی می کند:

  • lifecycleScope.launch(Dispatchers.IO) ، که از کوروتین های Kotlin برای راه اندازی متد loadXmlFromNetwork() در رشته IO استفاده می کند. URL فید را به عنوان پارامتر ارسال می کند. متد loadXmlFromNetwork() فید را واکشی و پردازش می کند. وقتی تمام شد، یک رشته نتیجه را به عقب ارسال می کند.
  • withContext(Dispatchers.Main) ، که از کوروتین های Kotlin برای بازگشت به رشته اصلی استفاده می کند، رشته برگشتی را می گیرد و در UI نمایش می دهد.

در زبان برنامه نویسی جاوا، فرآیند به صورت زیر است:

  • یک Executor متد loadXmlFromNetwork() روی یک رشته پس زمینه اجرا می کند. URL فید را به عنوان پارامتر ارسال می کند. متد loadXmlFromNetwork() فید را واکشی و پردازش می کند. وقتی تمام شد، یک رشته نتیجه را به عقب ارسال می کند.
  • یک Handler post برای بازگشت به رشته اصلی فراخوانی می کند، رشته برگشتی را می گیرد و آن را در UI نمایش می دهد.

کاتلین

// Implementation of Kotlin coroutines used to download XML feed from stackoverflow.com.
private fun downloadXml(vararg urls: String) {
    var result: String? = null
    lifecycleScope.launch(Dispatchers.IO) {
        result = try {
            loadXmlFromNetwork(urls[0])
        } catch (e: IOException) {
            resources.getString(R.string.connection_error)
        } catch (e: XmlPullParserException) {
            resources.getString(R.string.xml_error)
        }
        withContext(Dispatchers.Main) {
            setContentView(R.layout.main)
            // Displays the HTML string in the UI via a WebView.
            findViewById<WebView>(R.id.webview)?.apply {
                loadData(result?: "", "text/html", null)
            }
        }
    }
}

جاوا

// Implementation of Executor and Handler used to download XML feed asynchronously from stackoverflow.com.
private void downloadXml(String... urls) {
    ExecutorService executor = Executors.newSingleThreadExecutor();
    Handler handler = new Handler(Looper.getMainLooper());
    executor.execute(() -> {
        String result;
            try {
                result = loadXmlFromNetwork(urls[0]);
            } catch (IOException e) {
                result = getResources().getString(R.string.connection_error);
            } catch (XmlPullParserException e) {
                result = getResources().getString(R.string.xml_error);
            }
        String finalResult = result;
        handler.post(() -> {
            setContentView(R.layout.main);
            // Displays the HTML string in the UI via a WebView.
            WebView myWebView = (WebView) findViewById(R.id.webview);
            myWebView.loadData(finalResult, "text/html", null);
        });
    });
}

متد loadXmlFromNetwork() که از downloadXml فراخوانی می شود در قطعه بعدی نشان داده شده است. کارهای زیر را انجام می دهد:

  1. یک StackOverflowXmlParser را نمونه‌سازی می‌کند. همچنین متغیرهایی را برای List اشیاء Entry ( entries ) و title ، url و summary ایجاد می کند تا مقادیر استخراج شده از خوراک XML را برای آن فیلدها نگه دارد.
  2. downloadUrl() را فراخوانی می کند که فید را واکشی می کند و آن را به صورت InputStream برمی گرداند.
  3. از StackOverflowXmlParser برای تجزیه InputStream استفاده می کند. StackOverflowXmlParser List از entries با داده های فید پر می کند.
  4. List entries را پردازش می کند و داده های فید را با نشانه گذاری HTML ترکیب می کند.
  5. یک رشته HTML را که در UI فعالیت اصلی نمایش داده می شود، برمی گرداند.

کاتلین

// Uploads XML from stackoverflow.com, parses it, and combines it with
// HTML markup. Returns HTML string.
@Throws(XmlPullParserException::class, IOException::class)
private fun loadXmlFromNetwork(urlString: String): String {
    // Checks whether the user set the preference to include summary text.
    val pref: Boolean = PreferenceManager.getDefaultSharedPreferences(this)?.run {
        getBoolean("summaryPref", false)
    } ?: false

    val entries: List<Entry> = downloadUrl(urlString)?.use { stream ->
        // Instantiates the parser.
        StackOverflowXmlParser().parse(stream)
    } ?: emptyList()

    return StringBuilder().apply {
        append("<h3>${resources.getString(R.string.page_title)}</h3>")
        append("<em>${resources.getString(R.string.updated)} ")
        append("${formatter.format(rightNow.time)}</em>")
        // StackOverflowXmlParser returns a List (called "entries") of Entry objects.
        // Each Entry object represents a single post in the XML feed.
        // This section processes the entries list to combine each entry with HTML markup.
        // Each entry is displayed in the UI as a link that optionally includes
        // a text summary.
        entries.forEach { entry ->
            append("<p><a href='")
            append(entry.link)
            append("'>" + entry.title + "</a></p>")
            // If the user set the preference to include summary text,
            // adds it to the display.
            if (pref) {
                append(entry.summary)
            }
        }
    }.toString()
}

// Given a string representation of a URL, sets up a connection and gets
// an input stream.
@Throws(IOException::class)
private fun downloadUrl(urlString: String): InputStream? {
    val url = URL(urlString)
    return (url.openConnection() as? HttpURLConnection)?.run {
        readTimeout = 10000
        connectTimeout = 15000
        requestMethod = "GET"
        doInput = true
        // Starts the query.
        connect()
        inputStream
    }
}

جاوا

// Uploads XML from stackoverflow.com, parses it, and combines it with
// HTML markup. Returns HTML string.
private String loadXmlFromNetwork(String urlString) throws XmlPullParserException, IOException {
    InputStream stream = null;
    // Instantiates the parser.
    StackOverflowXmlParser stackOverflowXmlParser = new StackOverflowXmlParser();
    List<Entry> entries = null;
    String title = null;
    String url = null;
    String summary = null;
    Calendar rightNow = Calendar.getInstance();
    DateFormat formatter = new SimpleDateFormat("MMM dd h:mmaa");

    // Checks whether the user set the preference to include summary text.
    SharedPreferences sharedPrefs = PreferenceManager.getDefaultSharedPreferences(this);
    boolean pref = sharedPrefs.getBoolean("summaryPref", false);

    StringBuilder htmlString = new StringBuilder();
    htmlString.append("<h3>" + getResources().getString(R.string.page_title) + "</h3>");
    htmlString.append("<em>" + getResources().getString(R.string.updated) + " " +
            formatter.format(rightNow.getTime()) + "</em>");

    try {
        stream = downloadUrl(urlString);
        entries = stackOverflowXmlParser.parse(stream);
    // Makes sure that the InputStream is closed after the app is
    // finished using it.
    } finally {
        if (stream != null) {
            stream.close();
        }
     }

    // StackOverflowXmlParser returns a List (called "entries") of Entry objects.
    // Each Entry object represents a single post in the XML feed.
    // This section processes the entries list to combine each entry with HTML markup.
    // Each entry is displayed in the UI as a link that optionally includes
    // a text summary.
    for (Entry entry : entries) {
        htmlString.append("<p><a href='");
        htmlString.append(entry.link);
        htmlString.append("'>" + entry.title + "</a></p>");
        // If the user set the preference to include summary text,
        // adds it to the display.
        if (pref) {
            htmlString.append(entry.summary);
        }
    }
    return htmlString.toString();
}

// Given a string representation of a URL, sets up a connection and gets
// an input stream.
private InputStream downloadUrl(String urlString) throws IOException {
    URL url = new URL(urlString);
    HttpURLConnection conn = (HttpURLConnection) url.openConnection();
    conn.setReadTimeout(10000 /* milliseconds */);
    conn.setConnectTimeout(15000 /* milliseconds */);
    conn.setRequestMethod("GET");
    conn.setDoInput(true);
    // Starts the query.
    conn.connect();
    return conn.getInputStream();
}